python 정규표현식 예제

때로는 그룹을 사용하여 정규식의 일부를 수집할 수 있지만 그룹의 내용을 검색하는 데 관심이 없는 경우가 있습니다. 캡처되지 않은 그룹을 사용하여 이 사실을 명시적으로 만들 수 있습니다. 다른 정규식과 함께. 리터럴 백슬래시와 일치하려면 정규식에서 이스케이프해야 합니다. 원시 문자열 표기이의 경우 이는 r””을 의미합니다. 원시 문자열 표기법이 없으면 “\”를 사용하여 다음 코드 줄을 기능적으로 동일하게 만들어야 합니다. 그것은 당신이 일치하는 텍스트의 일부를 선택할 수 있습니다. 마지막으로 일치하는 캡처 그룹의 정수 인덱스 또는 일치하는 그룹이 전혀 없는 경우 없음입니다. 예를 들어, 식 (a)b, (a)))) 및 ((ab))는 lastindex ==1 문자열 `ab`에 적용된 경우, 식(a)(b)은 lastindex == 2를 가지며, 동일한 문자열에 적용된 경우. 보시다시피 정규 표현식은 매우 강력하며이 자습서에서는 파이썬에서 사용하는 법을 배웁니다. 다음 항목을 다룹니다: 전체 헤더 줄과 일치 하는 정규식을 작성 하 여 처리할 수 있습니다., 헤더 이름과 일치 하는 한 그룹 및 헤더의 값과 일치 하는 다른 그룹. 정규식 패턴은 일련의 바이트 코드로 컴파일된 다음 C로 작성된 일치하는 엔진에 의해 실행됩니다.

고급 사용을 위해 엔진이 지정된 RE를 실행하는 방법에 주의를 기울이고 더 빠르게 실행되는 바이트 코드를 생성하기 위해 특정 방식으로 RE를 작성해야 할 수 있습니다. 최적화는 일치하는 엔진의 내부를 잘 이해해야 하기 때문에 이 문서에서다루지 않습니다. 정규식의 일치항목으로 문자열을 분할합니다. 캡처 괄호가 RE에서 사용되는 경우 해당 내용도 결과 목록의 일부로 반환됩니다. 최대 분할이 0이 아닌 경우 최대 분할이 대부분의 최대 분할에서 수행됩니다. 정규표현식은 일부 응용 프로그램에 강력한 도구이지만 어떤 면에서는 동작이 직관적이지 않으며 때로는 예상대로 동작하지 않습니다. 이 섹션에서는 가장 일반적인 함정 중 일부를 가리킵니다. RE는 `가 일치할 수 없으므로 정규식 엔진은 문자에 대한 일치를 찾을 때까지 문자별로 문자를 역추적해야 합니다. 마지막 경기는 `<`에서 `>`로 확장되며, 이는 원하는 것이 아닙니다. 문자열에 REs를 넣으면 Python 언어가 더 간단해지만 다음 섹션의 주제인 한 가지 단점이 있습니다. 대부분의 문자와 문자는 단순히 자신과 일치합니다.

예를 들어 정규식 테스트는 문자열 테스트와 정확히 일치합니다. (이 RE 일치 테스트 또는 테스트뿐만 아니라 수 있도록 대/소문자를 구분하지 않는 모드를 활성화할 수 있습니다.) 프리들, 제프리. 정규 표현식 마스터링. 3rd ed., 오라일리 미디어, 2009. 이 책의 세 번째 버전은 더 이상 파이썬을 다루지 않지만 첫 번째 판은 좋은 정규 표현 패턴을 매우 자세하게 작성했습니다. 이 HOWTO는 예제에 표준 파이썬 인터프리터를 사용합니다. 먼저 파이썬 인터프리터를 실행하고 re 모듈을 가져 와서 RE를 컴파일하십시오 : 그래서 먼저 re 모듈의 5 가지 주요 기능을 소개한 다음 파이썬에서 일반적으로 사용되는 정규식을 만드는 방법을 볼 수 있습니다.

Tento obsah bol zaradený v Nezaradené. Zálohujte si trvalý odkaz.