[Python] HTML 파일에서 태그(Tag) 추출하기 (tuple or list 형 출력)
해당 포스트에서는 파이썬(Python)을 이용하여 HTML 태그(tag) 정보들을 추출하는 방법에 대해 설명합니다. 1. INTRO 웹 크롤링(Web Crawling)을 통해 수집한 HTML 파일에서 태그(tag)들을 추출하는 방법에 대해 설명합니다. 파이썬(Python)이 오픈 소스 언어이다 보니 다른 분들이 만들어 놓은 tag 추출 라이브러리들이 있을 수 있으나, 이번 포스트에서는 일반적으로 많이 사용하는 정규표현식을 이용하는 방법에 대해 설명합니다. 2. 샘플 데이터 생성 이번 설명에서 사용할 HTML 형식을 갖춘 텍스트 데이터를 생성합니다. testtext1 = """ My favorite website in the world is probably Udacity. If you want that l..