Programming/Python

[Python] 정규식 연속 중복 문자 제거

G_Gi 2021. 3. 23. 23:48
SMALL

정규식에 대해 정확히 알진 못한다.

 

구글링결과 내가 원하던 결과와 제일 비슷한 것을 찾을 수 있었다.

왜 이렇게 나오는지는 알아보자ㅏㅏㅏㅏㅏ

 

import re


test = 'abbbsdfcdZZZZ11111)'
test1 = re.sub('(([a-zA-Z0-9])\\2{1,})', '', test) # 연속된 같은 문자 변환 (2개이상)
test2 = re.sub('(([a-zA-Z0-9])\\2{2,})', '', test) # 연속된 같은 문자 변환 (3개이상)
test3 = re.sub('(([a-zA-Z0-9])\\2{3,})', '', test) # 연속된 같은 문자 변환 (4개이상)
test4 = re.sub('(([a-zA-Z0-9])\\2{4,})', '', test) # 연속된 같은 문자 변환 (5개이상)

print(test1) 
print(test2)  
print(test3)
print(test4)

########결과########
asdfcd)
asdfcd)
abbbsdfcd)
abbbsdfcdZZZZ)
LIST