csv 파일만 읽다가 json 파일을 읽어보아야 하는 상황을 겪게 되어, 이런저런 삽질을 통해 방법을 알게 되었다.
(1) JSON file -> data 읽기
path = '(json 파일이 있는 경로)'
records = [json.loads(line) for line in open(path, encoding = 'utf-8')]
이렇게 읽을 경우 list 형태로 데이터를 얻게 된다.
records[0].keys()
를 통해 dict형태의 key를 알 수 있고, 필요한 데이터를 직접 추출하면 된다.
(2) json URL -> 파일 다운로드
import json
import urllib.request
from urllib import request
url = '(json file의 url)'
savename = 'data.json'
request.urlretrieve(url,savename)
print('end')
이렇게 할 경우 직접 json형식의 파일을 다운로드 받아 (1)의 과정을 통해 데이터를 분석할 수 있다.
'TIL' 카테고리의 다른 글
[TIL] 나이브 베이즈 다시 이해하기 (0) | 2021.10.05 |
---|---|
[TIL] Gradient Vanishing 문제와 활성화 함수 (0) | 2021.09.20 |
[회고] 2021 카카오 인턴 간단 후기 (0) | 2021.08.31 |
[TIL] Hadoop의 기본 명령어 (사용자 커맨드) (0) | 2021.06.30 |
[TIL] 0610~0613 (0) | 2021.06.13 |