파이썬 프로젝트 (아마존 웹사이트 웹 스크래핑) 7 | 엑셀에 데이터 저장하기
·
Computer Science/Project
엑셀 파일에 데이터를 저장하려면 openpyxl 라이브러리를 사용할 수 있습니다. from openpyxl import Workbook# Set up Excel workbookwb = Workbook()ws = wb.activews.append(["ASIN", "Title", "Brand", "Amazon Choice", "Star Rating", "Rating Count", "Rufus Question #2", "Coupon Discount", "Scrape Time"])Workbook()을 사용하여 새로운 엑셀 파일을 생성하고, ws = wb.active로 활성 시트를 가져옵니다. ws.append()를 사용하여 첫 번째 행에 컬럼 헤더를 추가합니다. 이 헤더는 나중에 스크래핑한 데이터를 엑셀에 삽입..
파이썬 프로젝트 (아마존 웹사이트 웹 스크래핑) 6 | Selenium으로 제품 정보 수집하기 (2)
·
Computer Science/Project
# Extract Product Titletry: title = driver.find_element(By.ID, "productTitle").text.strip()except: title = "N/A"By.ID: By는 Selenium에서 요소를 찾을 때 사용하는 방법 중 하나입니다. By.ID는 HTML 요소의 ID 속성을 기준으로 요소를 찾습니다. 여기서는 ID가 "productTitle"인 요소를 찾습니다. strip() 메서드는 문자열의 양쪽 끝에 있는 공백을 제거합니다. # Extract Brand Nametry: brand = driver.find_element(By.ID, "bylineInfo").text.replace("Visit the ", "").replace(" Sto..
파이썬 프로젝트 (아마존 웹사이트 웹 스크래핑) 5 | Selenium으로 제품 정보 수집하기 (1)
·
Computer Science/Project
Amazon 제품 페이지 URL에서 특정 정보를 추출하는 웹 스크래핑 함수를 만들어 볼 겁니다.# Function to scrape product datadef scrape_amazon_product(url): # Open URL driver.get(url) time.sleep(3) # Get ASIN asin = get_asin_from_url(url) # Extract Product Title try: title = driver.find_element(By.ID, "productTitle").text.strip() except: title = "N/A" # Extract Brand Name try: brand ..
파이썬 프로젝트 (아마존 웹사이트 웹 스크래핑) 4 | Selenium을 사용하여 아마존 로그인 자동화하기
·
Computer Science/Project
Amazon의 Rufus Question은 로그인한 사용자만 볼 수 있습니다. 따라서 자동으로 데이터를 수집하려면 로그인을 자동화하는 과정이 필요합니다.Amazon 로그인 페이지로 이동하여 자동으로 이메일과 비밀번호를 입력하는 기능을 구현해 봅시다.# Amazon login credentialsamazon_email = input("Enter your Amazon email: ")amazon_password = getpass("Enter your Amazon password: ")우선 사용자의 Amazon 로그인 정보를 입력받아 저장합니다. getpass() 함수는 비밀번호 입력을 받아 amazon_password 변수에 저장합니다. input()과 달리 getpass()는 입력한 텍스트를 화면에 표시하..
파이썬 프로젝트 (아마존 웹사이트 웹 스크래핑) 3 | 크롬 옵션 설정
·
Computer Science/Project
제일 먼저 크롬 옵션을 설정해야 합니다. Chrome 옵션을 설정하는 이유는 Selenium이 브라우저를 자동으로 실행할 때, 원하는 동작 방식으로 제어하기 위해서입니다. 기본적으로 Chrome WebDriver는 일반적인 브라우저처럼 동작하지만, 크롤링이나 자동화 작업을 할 때 더 빠르고 안정적으로 실행하려면 추가적인 설정이 필요합니다.# Set up Chrome options# Customize the behavior of the Chrome browser when you launch it with WebDriverchrome_options = webdriver.ChromeOptions()chrome_options.add_argument("--start-maximized")chrome_options...
파이썬 프로젝트 (아마존 웹사이트 웹 스크래핑) 2 | 프로젝트 개요, Selenium
·
Computer Science/Project
이번 프로젝트의 목표는 파이썬을 사용하여 아마존 웹사이트에서 원하는 제품 정보를 자동으로 수집하는 것입니다. 다음과 같은 데이터를 각 제품에 대해 수집할 예정입니다.ASIN (Amazon Standard Identification Number): Amazon 제품을 고유하게 식별하는 번호.Title (제품명): 제품의 이름 또는 제목.Brand (브랜드): 제품의 브랜드명.Amazon Choice: 해당 제품이 'Amazon's Choice'로 표시되어 있는지 여부.Star Rating: 제품의 평균 별점.Rating Count: 제품에 대한 고객 리뷰의 총 개수.Rufus Question 2: 제품의 FAQ 섹션에서 두 번째 질문과 답변.Coupon Discounts: 제품에 적용 가능한 쿠폰 할인 정..
올리브한입
'Computer Science/Project' 카테고리의 글 목록