일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 코드블럭
- 의사 클래스
- DataFrame
- pywinauto
- idxmax
- Windows
- 파이썬
- highlight.js
- QueueHandler
- Python
- pycharm
- 멀티 로그인
- 금결원
- 퀀트
- Tistory
- 필기
- 진행 상황
- idxmin
- line number
- 금융결제원
- HTML
- OpenAPI+
- 구현
- 웹크롤링
- freeze_support
- 우리FIS
- 하이라이트
- 티스토리
- CSS
- multiprocessing
- Today
- Total
목록웹크롤링 (2)
맨땅에 헤딩하는 사람
먼저 이 포스트는 아래 블로그를 기반으로 작성되었다. http://blog.naver.com/tmddn3020/221851801072 R로 금융데이터 수집하기6 - (WICS 기준 섹터 정보) 5번 글에서는 우선주와 스펙주를 제외한 국내 종목들의 종목명 및 티커 데이터를 저장했습니다.이 티커데이... blog.naver.com 주식 DB를 구축하기 위해 가장 먼저 기업의 리스트를 DB화 해야한다. 모든 상장 기업을 반영하는 것은 물론 좋겠지만 데이터 공백이 존재할 수 있다는 점을 염려해서 WICS 중분류로 나뉘어진 기업의 리스트만을 DB화하기로 결정하였다. WICS에 대해 자세히 알고 싶은 사람은 내가 전에 올렸던 글을 참고바란다. 2020/07/16 - [퀀트/이론] - WICS FICS GICS KR..
로또 1등의 당첨 확률은 1/(45C6)으로 약 8백만 분의 1이다. 사막에서 바늘찾기와 같은 처참한 확률은 소위 말하는 '뽀록'이 제대로 터져야 당첨될 수 있다. 물론 복권당첨을 단순히 운의 영역으로 생각하지 않는 몇몇 사람들도 있으며 이들은 번호의 규칙성을 수학적, 통계학적으로 분석하여 다음 번호를 추론하려 한다. 그걸 보며 난 허황되지만 당첨점에 규칙성이 존재하지 않을까하는 생각을 하게 되었다. 동행복권 홈페이지에는 당첨점의 당첨횟수까지만 나와있으므로 당첨점이 몇 회차에 당첨되었는 지 데이터를 정리하기 위해서는 웹크롤링이 필요하다. 그림 1에서 보는 바와 같이 회차별로 당첨번호 배출점을 확인할 수 있다. 그러나 회차별 URL이 모두 https://dhlottery.co.kr/store.do?meth..