Python
-
12/06 : TIL | 리스트 요소의 합구하기 sum과 +=, 리스트와 튜플 합치기Today I Learned/Python 2022. 12. 7. 07:56
리스트의 합을 구하는 두가지 방법 items = [1,2,3,4,5] # 리스트의 sum print(sum(items)) # 변수선언하고 += final = 0 for item in items: final += item print(final) 리스트와 튜플 합치기 (= 리스트와 리스트 합치기) items = [1,2,3,4,5] a = (1,2) # a= [1,2]도 동일 items+= a print(items) #[1,2,3,4,5,1,2]
-
12/02 : TIL | BeautifulSoup 크롤링 결과를 리스트 key value 로 저장하고 싶다면, List VS. TupleToday I Learned/Python 2022. 12. 3. 01:51
Beautiful Soup 으로 크롤링하며 느낀 것 - 결과를 어떤 형태로 저장할지 생각하고 코드를 짜야한다. OpenCraft Full-Time Anywhere in the World 단순히 span 안의 string 다 가져오려면 다음과 같이 작성해도 된다. soup.find_all('span', class_="company") 하지만 나는 가져온 string이 어떤 정보인지 알려줄 key도 같이 저장하고 싶다. 예를 들면 a 안에 span이 3개씩 들어가 있는데, 첫번째 span은 회사명, 두번째는 계약형태, 세번째는 근무지역이다. result = { 'title': title.string, 'company': company.string, 'kind': kind.string, 'region': re..
-
11/29: TIL | BeautifulSoup 과 Selenium, 리스트 요소 출력하기Today I Learned/Python 2022. 11. 30. 08:07
BeautifulSoup 과 Selenium 과거 크롤링이 필요할 때 BeautifulSoup보다 Selenium을 더 많이 썼다. 네이버 기사 크롤링, 네이버 주가 크롤링은 BeautifulSoup으로 했고, OTT 및 영화 개봉예정 리스트 크롤링, 구글 이미지 크롤링은 Selenium으로 했다. 언제 어떤 걸 쓰는 게 좋은지 정확히는 모르겠지만, BeautifulSoup으로 크롤링이 안되는 사이트들이 있다. 버튼 클릭 혹은 스크롤을 내리면 더 많은 정보를 보여주는 사이트는 Selenium으로 작동시켜 더 많은 정보를 수집할 수 있다! 근데 Selenium은 좀 느리다. 쓸 때마다 이미지를 받아와서 그럴 수도 있지만, time.sleep을 안 걸어주면, 정보를 다 가져오기도 전에 창을 닫아버릴 수도 있..