패스트 캠퍼스[데이터분석 강의] _웹데이터 수집(크롤링, HTML,파인드함수)
*웹 크롤링?: 인터넷 상에 존재하는 데이터를 자동으로 수집하는 행위 : Request 라이브러리- 웹페이지 정보 가져오기: BeautifulSoup 라이브러리 - HTML 소스를 파싱(분석) 하여 원하는 정보 얻기 1. 사용자는 브라우저로 접속하고 싶은 주소(url)입력2. 브라우저가 해당주소의 서버에게 "페이지 구성정보를 줘"라고 요청 (request)3. 웹서버는 구성에 필요한 정보를 코드(html)형태로 전달(response)4. 브라우저는 서버가 전달 준 정보(html)를 해석해서 사용자 화면에 보여줌 * beautifulsoup4 - HTML은 태그로 이루어져 있고, 수많은 공백과 변화하는 소스들 때문에 오류가 있을 가능성이 높지만 beautifulsoup4을 이용하면 이러..
패스트 캠퍼스[데이터분석 강의]/BeautifulSoup
2024. 7. 4. 11:03