Regular Expression trong MongoDB



Regular Expression được sử dụng thường xuyên trong tất cả ngôn ngữ để tìm kiếm một pattern hoặc một từ trong bất cứ chuỗi nào. MongoDB cũng cung cấp tính năng Regular Expression để so khớp mẫu (Pattern matching) trong chuỗi bởi sử dụng toán tử $regex. MongoDB sử dụng PCRE (Perl Compatible Regular Expression) như là ngôn ngữ Regular Expression.

Không giống như Text Search, chúng ta không cần thực hiện bất cứ lệnh nào hoặc cấu hình nào để sử dụng Regular Expression.

Bạn theo dõi cấu trúc của Document dưới posts collection chứa các trường post_text và tags như sau:

{
   "post_text": "enjoy the mongodb articles on tutorialspoint",
   "tags": [
      "mongodb",
      "tutorialspoint"
   ]
}

Sử dụng regex trong MongoDB

Truy vấn regex sau tìm kiếm tất cả posts mà chứa chuỗi tutorialspoint trong đó:

>db.posts.find({post_text:{$regex:"tutorialspoint"}})

Truy vấn tương tự có thể viết như sau:

>db.posts.find({post_text:/tutorialspoint/})

Sử dụng regex với tùy chọn không phân biệt kiểu chữ

Để làm cho việc tìm kiếm là không phân biệt kiểu chữ, bạn sử dụng tham số $options với giá trị $i. Lệnh sau sẽ tìm kiếm các chuỗi mà có từ tutorialspoint, không quan tâm nó là chữ hoa hay thường.

>db.posts.find({post_text:{$regex:"tutorialspoint",$options:"$i"}})

Một trong các kết quả của truy vấn này là Document sau mà chứa từ tutorialspoint trong các kiểu chữ khác nhau:

{
   "_id" : ObjectId("53493d37d852429c10000004"),
   "post_text" : "hey! this is my post on TutorialsPoint", 
   "tags" : [ "tutorialspoint" ]
} 
 

Sử dụng regex cho các phần tử mảng

Chúng ta cũng có thể sử dụng khái niệm regex trên trường mảng. Điều này đặc biệt quan trọng khi chúng ta triển khai tính năng của các tags. Vì thế, nếu bạn muốn tìm kiếm tất cả các post có tags bắt đầu với từ tutorial, bạn có thể sử dụng code sau:

>db.posts.find({tags:{$regex:"tutorial"}})

Tối ưu hóa các truy vấn Regular Expression

  • Nếu các trường của Document là đã được lập chỉ mục, truy vấn sẽ sử dụng các giá trị đã lập chỉ mục này để so khớp với các Regular Expression. Điều này làm cho việc tìm kiếm nhanh hơn khi so sánh với việc quét toàn bộ Collection.

  • Nếu Regular Expression là một Prefix expression, tất cả so khớp là bắt đầu với một chuỗi ký tự cụ thể. Ví dụ, nếu regex là ^tut, thì truy vấn sẽ chỉ tìm các chuỗi bắt đầu với tut.

Loạt bài hướng dẫn học MongoDB cơ bản và nâng cao của chúng tôi dựa trên nguồn tài liệu của: Tutorialspoint.com

Follow fanpage của team https://www.facebook.com/vietjackteam/ hoặc facebook cá nhân Nguyễn Thanh Tuyền https://www.facebook.com/tuyen.vietjack để tiếp tục theo dõi các loạt bài mới nhất về Java,C,C++,Javascript,HTML,Python,Database,Mobile.... mới nhất của chúng tôi.

Các bài học lập trình MongoDB phổ biến khác tại VietJack: