[파이썬] 웹 스크래핑.4

* 시가총액 상위 구하기 (naver > 증권 > 시가총액)

url = https://finance.naver.com/sise/sise_market_sum.naver?&page=2

(첫번째 ; https://finance.naver.com/sise/sise_market_sum.naver 이지만, &page =1 해도 동일한 결과 )

여기선 1~5까지의 페이지만 구하기로 한다.

(필요하면 계속 구할수있지만)

종목들과 정보가 있는 table (class는 type_2) 에 있는 항목들을 찾는다
필요없는 정보는 (공백 들) 필터링해서 필요한 정보만 받는다
csv로 저장하기위한 file 준비를 한다.

* source

import csv
import requests
from bs4 import BeautifulSoup

url = "https://finance.naver.com/sise/sise_market_sum.naver?&page=" # apges에 page number 넣기

# file (csv)로 저장학위한 기반 작업
filename = "시가총액.csv"
f = open(filename, "w", encoding="utf-8-sig", newline="")
writer = csv.writer(f)

# csv의 헤더값 넣기
title = "N	종목명	현재가	전일비	등락률	액면가	시가총액	상장주식수	외국인비율	거래량	PER	ROE".split('\t')
writer.writerow(title)

for page in range(1,5):
    res = requests.get(url + str(page) )
    res.raise_for_status()
    soup = BeautifulSoup(res.text, "lxml")

    data_rows = soup.find("table", attrs={"class":"type_2"}).find("tbody").find_all("tr")
    for row in data_rows:
        columns = row.find_all("td")

        if len(columns) <= 1: #의미없는 공백 등의 데이터 skip
            continue
            
        # 공백도 없애기. strip()
        data = [column.get_text().strip() for column in columns]
        writer.writerow(data)

기본적인 웹 정보 수집 -> csv 파일로 만들기 까지.

'프로그래밍&IT > 파이썬' 카테고리의 다른 글

[파이썬] 웹 스크래핑.6 - Selenium 추가 내용 , 메서드, 속성 (0)	2021.10.26
[파이썬] 웹 스크래핑.5 - Selenium 기본 (0)	2021.10.25
[파이썬] 웹 스크래핑.3 - BeautifulSoup4 - 2. find_all [+ http 메소드:get,post] (0)	2021.10.23
[파이썬] 웹 스크래핑.3 - BeautifulSoup4 - 1. 설치 및 기본적인 찾기 (0)	2021.10.22
[파이썬] 웹 스크래핑.2 - 정규 표현식 (regular expression) (0)	2021.10.21

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

N개의 Job을 가지다.

[파이썬] 웹 스크래핑.4 - CSV 기본

* 시가총액 상위 구하기 (naver > 증권 > 시가총액)

* source

'프로그래밍&IT > 파이썬' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

[파이썬] 웹 스크래핑.4 - CSV 기본

* 시가총액 상위 구하기 (naver > 증권 > 시가총액)

* source

'프로그래밍&IT > 파이썬' 카테고리의 다른 글

'프로그래밍&IT/파이썬' Related Articles

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역