Строка регулярного выражения с 3 или более гласными

Я пытаюсь создать регулярное выражение, которое соответствует строке с 3 или более гласными.

Я пробовал это:

[аиоу] {3,}

Но это работает только тогда, когда гласные находятся в последовательности. Какие-нибудь советы ?

Например:

Самуил -> действительный
Джоан -> инвалид
Сол Мануэль -> действительный
Сол -> Неверный

regex

Community 23.05.2017 источник

comment

Три или более разных гласных или одинаковые? - Rahul 23.05.2017

comment

Неважно, разные они или одинаковые - 23.05.2017

comment

@Green_Sam, опубликуйте несколько допустимых и недопустимых примеров - RomanPerekhrest 23.05.2017

comment

попробуй так: (?:[aeiou][^aeiou]*){3} - bobble bubble 23.05.2017

comment

\b\w*[aeiouAEIOU]\w*[aeiouAEIOU]\w*[aeiouAEIOU]\w*\b Может быть, что-то еще в этом духе? - quackenator 23.05.2017

comment

Просто сопоставьте все вхождения [aeiou] и подсчитайте совпадения. - Wiktor Stribiżew 23.05.2017

comment

@Green_Sam, если мой ответ ниже помог, примите его :) - sniperd 27.07.2017

Ответы (5)

arrow_upward
2
arrow_downward

Есть несколько способов сделать это, и в этом случае простота, вероятно, будет наиболее полезна для будущих разработчиков, поддерживающих этот код. Это забавная часть регулярных выражений, вы можете сделать их очень эффективными и умными, а затем очень трудно обновлять их для тех, кто не делает их часто.

import re

regex = "[aeiou].*[aeiou].*[aeiou]"

mylist = [
"Samuel",  #yes!
"JOAN",  #no!
"Sol Manuel",  #yes!
"",  #no!
]

for text in mylist:
    if re.search(regex, text, re.IGNORECASE):
        print ("Winner!")
    else:
        print ("Nein!")

Вы также можете настроить каждую часть на [aeiouAEIOU], если у вас нет флага игнорирования регистра на выбранном вами языке. Удачи! :)

sniperd 23.05.2017

arrow_upward
3
arrow_downward

просто

(\w*[aeuio]\w*){3,}

или если вы хотите совпадение строк

^(.*[aeuio].*){3,}$

Mehdi Khademloo 23.05.2017

arrow_upward
0
arrow_downward

Это может быть достигнуто с помощью просмотра вперед, как это.

Регулярное выражение: ^(?=.*[aeiou].*[aeiou].*[aeiou])(?:[a-z] *)+$

Пояснение:

(?=.*[aeiou].*[aeiou].*[aeiou]) положительный просмотр вперед проверяет наличие любого символа, за которым следует гласная три раза.
(?:[a-zA-Z] *)+ соответствует одному или нескольким вашим английским словам, разделенным пробелами.

Демо Regex101

Если режим без учета регистра выключен, используйте следующее регулярное выражение

Регулярное выражение: ^(?=.*[aeiouAEIOU].*[aeiouAEIOU].*[aeiouAEIOU])(?:[a-zA-Z] *)+$

Демо Regex101

Rahul 23.05.2017

comment

Я не думаю, что просмотр вперед является наиболее эффективным способом решения этой проблемы. - Tim Biegeleisen; 23.05.2017

comment

@TimBiegeleisen: Согласен! Это альтернатива прямому совпадению. Наиболее эффективным было бы сопоставление и подсчет количества гласных, как упомянул Виктор в комментарии. - Rahul; 23.05.2017

arrow_upward
0
arrow_downward

Попробуйте этот шаблон:

^.*[AEIOUaeiou].*[AEIOUaeiou].*[AEIOUaeiou].*$

Мы также могли бы использовать положительный взгляд вперед:

^(?=.*[AEIOUaeiou].*[AEIOUaeiou].*[AEIOUaeiou]).*$

Обратите внимание, что из-за возможности обратного отслеживания я, вероятно, предпочел бы использовать первый шаблон (без просмотра вперед), потому что он должен быть более эффективным.

Tim Biegeleisen 23.05.2017

comment

не будет ли это также соответствовать пробелам? - quackenator; 23.05.2017

comment

@quackenator Я не знаю, о чем ты говоришь. - Tim Biegeleisen; 23.05.2017

comment

такое жало, как doo de, будет соответствовать вашему первому регулярному выражению - quackenator; 23.05.2017

comment

Где ОП упоминал что-либо об отдельных словах? Одним из приведенных примеров соответствия является Sol Manuel, состоящее из двух слов. - Tim Biegeleisen; 23.05.2017

comment

^.* и .*$, похоже, не нужны. - NetMage; 24.05.2017

arrow_upward
0
arrow_downward

Я попробовал это, используя помощь снайперского ответа:

def multi_vowel_words(text):
   pattern = r"\w+[aeiou]\w*[aeiou]\w*[aeiou]\w+"
   result = re.findall(pattern, text)
   return result

Это работает даже с заглавными буквами.

Если в вашем тексте есть цифры и подчеркивание, то вместо \w используйте [a-zA-Z].

Ujjawal 28.03.2020

Строка регулярного выражения с 3 или более гласными

Ответы (5)

Похожие вопросы