티스토리 뷰

목차



    반응형

     

    이제부터는 점점 웹스크래핑을 할 수 있는 능력에 가까워지고 있습니다. 만약 문자열에서 추출하고 싶은 여러 조각의 텍스트가 있다면 어떻게 할까요?  예를 들어 'Rob, Kirsten, Tommy, Ralphie'라는 문자열이 있다고 합시다. 그리고 각각의 이름을 추출하고 싶다고 합시다. 

     

     

     

    회원가입후 로그인하세요

     

     

    정규표현식으로 가능하지만 다른 방법을 사용해 보겠습니다. 문자열을 나눠서 리스트로 만듭니다. 

     

    string.split(",") 라는 명령어를 이용합니다.  ","로 문자열을 나눈다는 의미입니다.  아래와 같이 문자열을 나눠봅니다. 

     

     

    string = "Rob, Kirsten, Tommy, Ralphie" 

       print(string.split(","))

     

    주의사항 : 이번에는 'import re'가 필요하지 않습니다. 정규표현식을 사용하지 않기 때문입니다. 

     


    결과는 4개의 이름으로 된 리스트가 나옵니다. 

     

     

     

    위코드에 대한 결과물은 아래와 같습니다. 

     

     

     

    , (쉼표)를 기준으로 앞뒤의 단어들을 위처럼 배열해 줍니다. 

     

     

    반응형