Logo
Sean Williams
 

데이터 셋 다운로드

posted on 6 Feb 2020 at 3:10 pm

고맙게도 Quandl은 이미 정리된 데이터를 제공하는 경제 및 금융 데이터의 저장소입니다. 또한 예측을 할 흥미로운 대상 열이 있으며 다른 변수에는 대상 열에 대한 설명 능력이 있습니다. 따라서 Quandl은 기계 학습 알고리즘을 테스트하기위한 완벽한 선택이 될 것이며 데이터 정리에 시간을 낭비하지 않습니다. 데이터 정리 프로젝트에 대한 좋은 데이터 집합을 찾고 있다면 다음과 같은 방법을 원합니다: 데이터에 관심이 있다면 FiveThirtyEight에 대해 거의 확실하게 들어보았습니다. 그것은 세계에서 가장 잘 설립 된 데이터 저널리즘 아울렛 중 하나입니다. 그들은 “제조 업종의 고용 부족에 대한 기술 격차를 비난하지 마십시오”와 “2016 NFL 예측”과 같은 흥미로운 데이터 기반 기사를 작성합니다. 이 사이트가 여기 있고 첫눈에, 그것은 데이터 과학과 아무 관계가 없는 이유를 놀라게 될 수 있습니다. 음, 네, BuzzFeed는 뉴스 및 엔터테인먼트 콘텐츠를 제공하는 크로스 플랫폼 디지털 미디어 회사입니다. 그러나 진실은 이것이 흥미롭고 유용한 옵션의 전체 스펙트럼을 유지하는 다기능 서비스이며, 당신이 짐작할 수 있듯이 무료 데이터 세트는 예외가 아닙니다. 데이터 과학 소개 과정과 데이터 과학 커리어 트랙의 학습을 바탕으로 첫 번째 프로젝트에서 잘 작동한다고 생각하는 다양한 유형과 복잡성의 데이터 세트를 선택했습니다 (그 중 일부는 연구 프로젝트에서도 작동합니다!).

이러한 데이터 세트는 인구 통계 학적 데이터, 경제 데이터, 텍스트 데이터 및 기업 데이터와 같은 다양한 소스를 다룹니다. 따라서 FiveThirthyEight는 데이터 과학자와 함께 작업할 수 있는 자료를 찾는 데 있어 많은 흥미로운 정보에 적합합니다. 그들은 하드 데이터와 통계 분석을 사용하여 정치, 스포츠, 사회 문제 등에 대한 이야기를 합니다. 위키백과는 무료 온라인, 커뮤니티 편집 백과사전입니다. 그것은 지식의 놀라운 폭을 포함, 레너드 니모이에 오스만 합스부르크 전쟁에서 모든 페이지를 포함. 지식을 발전시키기 위한 위키백과의 노력의 일환으로, 그들은 모든 콘텐츠를 무료로 제공하고 정기적으로 사이트의 모든 기사의 덤프를 생성합니다. 또한 위키백과에서는 편집 기록 및 활동 데이터를 제공하므로 주제에 대한 페이지가 시간이 지남에 따라 어떻게 발전하고 누가 기여하는지 추적할 수 있습니다. 두 차원에 걸쳐 국가의 문화적 근접성을 측정하고 다른 기간에 대해 세계 가치 조사에서 계산한 집계된 데이터 집합입니다. 작지만 흥미로운 데이터 집합입니다. 위의 표는 매우 작고 질문에 대한 평균 등급을 제공합니다 얼마나 행복 당신은 요즘 말할 것인가? 등급 1 (낮은) 에 10 (높은) 국가 및 성별에 의해. 자체적으로이 데이터 집합은이 클래스 프로젝트에 대 한 충분 하지 않습니다. 다른 질문에 대한 답변을 다운로드하고 시각화하는 것이 좋습니다.

이를 위해 유로파운드 웹 사이트로 이동하여 왼쪽의 질문을 선택한 다음 하단 링크를 사용하여 csv 파일을 다운로드합니다. Kaggle은 기계 학습 대회를 주최하는 데이터 과학 커뮤니티입니다.

Comments are closed.