Урок 16
Регулярные выражения
20 минРегулярные выражения (Regular Expressions, Regexp) — это мощный инструмент для поиска и обработки текста по шаблонам. Они используются для валидации, поиска и замены.
Что такое регулярные выражения?
Регулярное выражение — это шаблон, описывающий набор строк. Например, шаблон для email, телефона или URL.
Где используются: Валидация форм, парсинг текста, поиск и замена, фильтрация данных, работа с логами.
Синтаксис регулярных выражений
Регулярка заключается в разделители (обычно /):
/шаблон/модификаторы
Основные метасимволы:
| Символ | Значение | Пример |
|---|---|---|
. | Любой символ | /a.c/ — abc, aXc |
^ | Начало строки | /^Hello/ |
$ | Конец строки | /world$/ |
* | 0 или более | /ab*c/ — ac, abc, abbc |
+ | 1 или более | /ab+c/ — abc, abbc |
? | 0 или 1 | /colou?r/ — color, colour |
{n} | Ровно n раз | /a{3}/ — aaa |
{n,m} | От n до m раз | /a{2,4}/ — aa, aaa, aaaa |
[abc] | Один из символов | /[aeiou]/ — гласные |
[^abc] | Любой кроме | /[^0-9]/ — не цифра |
\d | Цифра [0-9] | /\d+/ — числа |
\w | Буква/цифра/_ | /\w+/ — слова |
\s | Пробельный символ | /\s+/ — пробелы |
preg_match — поиск совпадения
preg_match_all — все совпадения
preg_replace — замена
Практические примеры валидации
Модификаторы
| Модификатор | Значение |
|---|---|
i | Без учёта регистра |
m | Многострочный режим |
s | Точка соответствует и переносу строки |
u | UTF-8 режим (для кириллицы обязательно!) |
Важно для кириллицы: Всегда используйте модификатор
u при работе с русским текстом: /[а-яё]+/iu
Материалы по теме
- Глоссарий digital-терминов Глоссарий
- Статьи блога по разработке и SEO Блог
- Практические чеклисты по внедрению Чеклисты