[WebCrawling] 웹사이트를 직접 분석해보자 -6편

2022. 12. 27. 00:00·활동내역.zip/개인
728x90

Type: 데이터 수집 / 분석

주제: Web Crawling

사용 IDE: IntelliJ IDEA

사용 언어: Python

사용 패키지: selenium, BeautifulSoup

GitHub Link: https://github.com/TMInstaller/WebCrawling_Myblog

더보기
 

GitHub - TMInstaller/WebCrawling_Myblog: WebCrawling project demo

WebCrawling project demo. Contribute to TMInstaller/WebCrawling_Myblog development by creating an account on GitHub.

github.com


설계 - 어떤 기능을 추가할까?

이번 편의 목표는 다음과 같다

목표1: 코드 함수화 및 옮겨두기
목표2: 얻은 정보를 csv파일을 생성하여 저장하기

코드 작성

1. 기존 코드 옮겨서 함수로 만들어두기

2. csv파일을 생성해서 저장하는 일련의 과정 하기


이번 글에서는 .write 기능을 이용하여 파일을 생성해 넣는 간단한 작업을 진행하였고

이 프로젝트를 여기서 일단락 하였다

웹 크롤링에 대해 굉장히 간단한 작업이라고 생각하고 있었던 나에게 신선한 충격을 주었던 일이었고,

중간중간 문제해결능력이 필요했을 때

파이썬 알고리즘 연습을 진행하였던 일들이 굉장히 의미있었던 것 같다


전체 코드

 마지막 코드는 위의 깃허브 링크에서 확인할 수 있다


시리즈 종료!

지금까지 글을 읽어주셔서 감사합니다

728x90
저작자표시 비영리 변경금지 (새창열림)

'활동내역.zip > 개인' 카테고리의 다른 글

[ Challenge to SW Maestro ] 2주차 회고  (0) 2023.02.17
[ Challenge to SW Maestro ] 1주차 회고  (0) 2023.02.10
[WebCrawling] 웹사이트를 직접 분석해보자 -5편  (0) 2022.12.06
[WebCrawling] 웹사이트를 직접 분석해보자 -4편  (0) 2022.12.05
[WebCrawling] 웹사이트를 직접 분석해보자 -3편  (0) 2022.12.05
'활동내역.zip/개인' 카테고리의 다른 글
  • [ Challenge to SW Maestro ] 2주차 회고
  • [ Challenge to SW Maestro ] 1주차 회고
  • [WebCrawling] 웹사이트를 직접 분석해보자 -5편
  • [WebCrawling] 웹사이트를 직접 분석해보자 -4편
ThreeLight
ThreeLight
ThreeLight Studio의 블로그, TimeMap.exe에 오신 것을 환영합니다.
  • ThreeLight
    TimeMap.exe
    ThreeLight
  • 전체
    오늘
    어제
    • 분류 전체보기 (245)
      • Checkpoint (1)
      • (3D)Dev Deep Dive (0)
        • Templates & Guides (9)
        • Frontend origin (9)
        • Backend origin (1)
        • TroubleShootings (4)
      • Development Study (95)
        • Frontend (36)
        • Backend (21)
        • CS(Computer Science) (2)
        • Background Knowledges (11)
        • Algorithm (2)
        • Mobile (3)
        • AWS (6)
        • Python (6)
        • MSW(MapleStoryWorlds) (8)
      • Coding Test (59)
        • 문제.zip (1)
        • BaekJoon_JavaScript (0)
        • Programmers_JavaScript (9)
        • BaekJoon_Python (23)
        • Programmers_Python (10)
        • Undefined_Python (3)
        • Programmers_SQL (13)
      • 활동내역.zip (43)
        • 개인 (21)
        • Techeer (12)
        • Bootcamp (7)
        • Hackathon (1)
        • TeamProjects (2)
      • 여기 괜찮네??(사이트 | App) (5)
      • 재미있는 주제들 (8)
      • 개발 외 공부 저장소 (11)
        • 생산운영관리 (3)
        • 생활속의금융 (6)
        • 경영정보시스템 (2)
  • 링크

    • TimeMap.dmg (Portfolio)
    • GitHub 바로가기
    • 오픈프로필(카카오톡)
    • Medium 바로가기
    • Disquiet 바로가기
    • LinkedIn 바로가기
  • 인기 글

  • 태그

    JavaScript
    Python
    programmers
    SQL
    Baek Joon
    프로그래머스
    react
    HTML
    TypeScript
    CSS
  • 최근 글

  • 최근 댓글

  • hELLO· Designed By정상우.v4.10.1
ThreeLight
[WebCrawling] 웹사이트를 직접 분석해보자 -6편
상단으로

티스토리툴바