close

Regex là gì? 5+ biểu thức Regex áp dụng ngay!

Tác giả: TinoHost Ngày cập nhật: 01/08/2021 Chuyên mục: Webmasters
Disclosure
Website Wiki.tino.org được cung cấp bởi Tino Group. Truy cập và sử dụng website đồng nghĩa với việc bạn đồng ý với các điều khoản và điều kiện trong chính sách bảo mật - điều khoản sử dụng nội dung. Wiki.tino.org có thể thay đổi điều khoản sử dụng bất cứ lúc nào. Việc bạn tiếp tục sử dụng Wiki.tino.org sau khi thay đổi có nghĩa là bạn chấp nhận những thay đổi đó.
Why Trust Us
Các bài viết với hàm lượng tri thức cao tại wiki.tino.org được tạo ra bởi các chuyên viên Marketing vững chuyên môn và được kiểm duyệt nghiêm túc theo chính sách biên tập bởi đội ngũ biên tập viên dày dặn kinh nghiệm. Mọi nỗ lực của chúng tôi đều hướng đến mong muốn mang đến cho cộng đồng nguồn thông tin chất lượng, chính xác, khách quan, đồng thời tuân thủ các tiêu chuẩn cao nhất trong báo cáo và xuất bản.

Regex là gì? Bạn có biết được những cú pháp và công dụng “thần thánh” Regex chưa? Hãy cùng Tino Group tìm ra câu trả lời nhé!

Regex là gì?

Regex (hoặc bạn cũng có thể viết là là RegEx) được viết tắt từ Regular Expression, tạm dịch: biểu thức chính quy. Nếu là một lập trình viên, bạn sẽ rất quen thuộc với việc sử dụng Regex để so khớp tổ hợp ký tự trong một chuỗi, ví dụ như: Số điện thoại, email hay url web,…

regex-la-gi

Mỗi ngôn ngữ lập trình sẽ có cách thể hiện biểu thức Regex hơi khác nhau một ít. Tuy nhiên, điều này không làm ảnh hưởng đến hoạt động của Regex. Nên bạn chỉ cần nắm những kiến thức cơ bản về Regex và tùy biến theo ngôn ngữ bạn sử dụng.

Có thể nói rằng, Regex được nhà toán học Stephen Cole Kleene thực hiện mô tả lần đầu tiên vào năm 1951 bằng cách sử dụng các ký hiệu toán học. Bạn đầu, ông gọi là regular events (sự kiện thường xuyên). Cho đến cuối thế kỉ 20, việc sử dụng Regex trong khoa học máy tính trở nên phổ biến hơn. Bạn có thể tham khảo thêm về lịch sử hình thành của Regex trên Wikipedia phiên bản tiếng Anh.

Ứng dụng của Regex trong việc so khớp

Đây là một trong những ứng dụng điển hình và được sử dụng nhiều bật nhất bởi các lập trình viên rồi. Các ví dụ điển hình bạn thường gặp như:

  • So khớp và kiểm tra tính hợp lệ của Email
  • So khớp và kiểm tra tính hợp lệ của URL
  • So khớp và kiểm tra tính hợp lệ của số điện thoại
  • So khớp các ký tự trong một chuỗi bắt đầu bằng a kết thúc bằng z
  • Và vô số trường hợp khác nữa.

Bạn có thể suy luận ra được rồi đúng không: bạn có thể tìm kiếm và kiểm tra bất cứ thứ gì với chuỗi miễn là chúng có một quy tắc rõ ràng.

Ví dụ: Bạn muốn tìm một chuỗi ký tự ngẫu nhiên bắt đầu bằng a kết thúc bằng z ở giữa có chữ số, bạn có thể viết một biểu thức Regex đơn giản như sau:

^a.*[0-9].*z$

Bạn nhập ngẫu nhiên 1 vài chuỗi vào, trong đó, 2 chuỗi được phát hiện có chính xác những điều kiện: bắt đầu bằng a kết thúc bằng z ở giữa có chữ số là:

aDrgu3432z a8w38484z.

regex-la-gi

Ứng dụng của Regex trong việc tìm kiếm và thay thế

Có lẽ bạn cũng đã từng thao tác Ctrl + H trong Word để tìm kiếm một ký tự hay một từ nào đó rồi đúng không?

Giờ đây, bạn có thể Ctrl + H trong các phần mềm lập trình kết hợp với sức mạnh của Regex để việc tìm kiếm – thay thế của bạn trở nên dễ dàng hơn bao giờ hết.

regex-la-gi

Ví dụ, bạn có một loạt link như sau và bạn muốn chuyển đổi từ https://www.tên-miền.xxx thành <a href=”https://www.tên-miền.xxx”target=”_blank”>tên-miền.xxx</a>. Khi sử dụng if/else bạn sẽ mất rất nhiều thời gian!

Tuy nhiên, với Regex bạn chỉ cần 2 dòng lệnh trong hộp thoại Find and Replace như sau:

  • Find: (http://www\.(+))
  • Replace: <a href=”$1″ target=”_blank”>$2></a>

Kết quả bạn sẽ có được như trong ảnh. Thật quá đỗi tiện nghi và xuất sắc đúng không nào!

regex-la-gi

Bạn có thể tiếp tục tùy biến thêm và thực hiện các hoạt động như: Tách chuỗi, kết hợp với grep,… Nhằm giảm thiểu thời gian làm việc với nội dung hơn.

Ý nghĩa ký tự trong Regex

Một số siêu ký tự cơ bản

  • ^ Bắt đầu một chuỗi ký tự. Trường hợp dấu ^ xuất hiện tiếp nối phía sau dấu ngoặc vuông là phủ định những gì có bên trong ngoặc [^
  • $ Kết thúc một chuỗi ký tự
  • . Chọn mọi ký tự ngoại trừ \n newline
  • | Phép tương đương
  • {…} Tập hợp ký tự
  • […] Tập hợp ký tự phải chính xác để khớp
  • (…) Tạo nhóm logic
  • * 0 hoặc nhiều hơn biểu thức trước đó.
  • + 1 hoặc nhiều hơn biểu thức trước đó.
  • ? 0 or 1 so sánh đúng tối thiểu 1 ký tự
  • / Dùng để bắt đầu hoặc kết thúc chuỗi
  • \ Dùng để tạo ra một ký tự thay thế đặc biệt thành ký tự thường và ngược lại. Bạn có thể tham khảo ảnh bên dưới để hiểu hơn.
regex-la-gi

Một số biểu thức thường thấy

  • a|b Trùng khớp với a hoặc trùng khớp với b
  • [0-9] TÌm kiếm trùng khớp với chữ số từ 0 tới 9
  • [a-z] Tìm kiếm miễn sao có trong khối ký tự từ a tới z
  • [abc] Trùng khớp với 1 trong 3 a, b, c
  • [^abc] Loại trừ khớp với 3 ký tự a, b và c

Một số biểu thức Regex mẫu để áp dụng ngay

Việc sử dụng những biểu thức Regex có sẵn luôn là vấn đề được cộng đồng đem ra mổ xẻ đúng sai. Tôi không ủng hộ phía nào, nhưng sử dụng những biểu thức Regex có mức độ phức tạp cao và đã được cộng đồng đánh giá cũng như sửa đổi sẽ tốt hơn so với việc đi viết lại từ đầu.

Nếu bạn vừa bắt đầu và muốn thử nghiệp, áp dụng cũng như thực hành. Những biểu thức Regex sẵn có sẽ là lựa chọn lý tưởng cho bạn.

Trong phần này, Tino Group tổng hợp lại các biểu thức Regex sẵn có trên mạng từ nhiều nguồn để bạn có thể tham khảo.

Để thử nghiệm, bạn có thể dán biểu thức vào trang này và kiểm thử.

regex-la-gi

Một số biểu thức Regex ngắn gọn thường dùng

Biểu thức Regex so khớp số điện thoại ở Việt Nam

Biểu thức: \+?(0|84)\d{9}

Sử dụng để kiểm tra số điện thoại bắt đầu bằng 0 hoặc 84 kèm 9 số cuối phía sau.

Biểu thức Regex so khớp tên riêng viết hoa

Biểu thức: (?:[A-Z]\p{L}+ ){1,3}[A-Z]\p{L}+

Sử dụng để tìm kiếm những tên riêng được viết hoa

Biểu thức Regex dùng để kiểm tra thẻ HTML

Biểu thức: <[^>]*>

Sử dụng để kiểm tra đóng mở ngoặc của các thẻ trong HTML.

Một số biểu thức so khớp phức tạp hơn

Biểu thức Regex so khớp URL

  • (http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&amp;:/~\+#]*[\w\-\@?^=%&amp;/~\+#])?
  • ^(http|https|ftp)\://[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,3}(:[a-zA-Z0-9]*)?/?([a-zA-Z0-9\-\._\?\,\’/\\\+&amp;%\$#\=~])*$
  • ((mailto\:|(news|(ht|f)tp(s?))\://){1}\S+)
  • ^((https?|ftp|file):\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$
regex-la-gi

Biểu thức Regex so khớp Email

  • ^([a-zA-Z0-9_\-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([a-zA-Z0-9\-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?)$
  • ^\w+[\w-\.]*\@\w+((-\w+)|(\w*))\.[a-z]{2,3}$
  • ^.+@.+$
  • ^\w+@[a-zA-Z_]+?\.[a-zA-Z]{2,3}$
  • ^[\w-\.]+@([\w-]+\.)+[\w-]{2,4}$
regex-la-gi

Qua bài viết, Tino Group đã giúp bạn có thể hiểu được về Regex là gì, tìm hiểu về ứng dụng cũng như một số biểu thức Regex mẫu để bạn có thể áp dụng ngay. Tino Group mong bạn sẽ có thể sử dụng Regex thật tốt cho công việc và học tập của mình!

Bài viết có tham khảo nội dung từ Regexlib.com, Lập trình không khó (nguyenvanhieu.vn),…

Những câu hỏi thường gặp về Regex

Học Regex ở đâu?

Nếu bạn muốn đào sâu hơn để tìm hiểu về Regex, RegexLib.com sẽ là một nơi lý tưởng của bạn. Tại đây, bạn sẽ được giới thiệu và bạn cũng có thể tìm kiếm hầu hết các hướng dẫn để sử dụng Regex.

Nên lưu ý gì khi sử dụng Regex?

Khi bạn viết ra được một biểu thức Regex, điều đầu tiên bạn cần làm là ghi chú lại biểu thức của bạn đang xử lý thứ gì và xử lý như thế nào. Đừng tin tuyệt đối vào trí nhớ của mình, chỉ ít lâu sau, bạn sẽ quên bén dòng biểu thức bạn viết ra có nghĩa là gì đấy! Việc ghi chú sẽ áp dụng cho cả quá trình lập trình của bạn nữa.

Tìm hiểu hướng dẫn sử dụng Regex trong Google Analytics ở đâu?

Nếu bạn đang muốn sử dụng Regex để phân tích các dữ liệu từ Google Analytics, bạn có thể truy cập vào Giới thiệu về biểu thức chính quy (Regex) của Analytics support để tìm hiểu thêm nhé!

Những trang nào có thể giải đáp ý nghĩa của Regex?

Bạn có thể sử dụng những trang như: Regex101.com, rubular.com để thử nghiệm nhé! Bạn chỉ cần dáng biểu thức Regex của mình vào, nhập các chuỗi thử nghiệm là xong. Đây là những trang khá tốt để bạn có thể tự kết hợp và sáng tạo ra biểu thức Regex của riêng mình đấy!

Chia sẻ một chút thông tin về bạn. Những thông tin này có thể được công khai.

Xem thêm bài viết

Bài viết liên quan

CÔNG TY CỔ PHẦN TẬP ĐOÀN TINO
Trụ sở chính: L17-11, Tầng 17, Tòa nhà Vincom Center, Số 72 Lê Thánh Tôn,  Phường Bến Nghé, Q. 1, TP. Hồ Chí Minh

Văn phòng kinh doanh: Số 42 Trần Phú, Phường 4, Quận 5, TP HCM
GPKD số 0315679836 do Sở KH và ĐT TP Hồ Chí Minh cấp
Hotline: 0364 333 333
Góp ý/Phản ánh dịch vụ: 0933 000 886