API 로 데이터 수집하기

2026. 4. 22. 13:48·🤖​AI Tools/AI 리뷰 분석

API 로 데이터 수집하기

Steamreviews 로 리뷰 수집


1. steamreviews 설치

!pip install steamreviews -q

import steamreviews
print(f"steamreviews 설치 완료!")

-q 는 설치 과정을 조용히 ( quiet ) 출력


2. 리뷰 수집하기

import steamreviews

# 게임 ID 설정
app_id = 3159330

# 리뷰 수집
review_dict, query_count = steamreviews.download_reviews_for_app_id(
    app_id,
    chosen_request_params={'language': 'korean'}
)

print(f"수집된 리뷰 수 : {len(review_dict['reviews'])}")
print(f"API 요청 횟수 : {query_count}")
[appID = 3159330] expected #reviews = 1197
수집된 리뷰 수 : 1195
API 요청 횟수 : 13

3. 데이터 구조 살펴보기

first_review_id = list(review_dict['reviews'].keys())[0]
first_review = review_dict['reviews'][first_review_id]

print("리뷰 데이터 키 : ")
print(first_review.keys())
리뷰 데이터 키 : 
dict_keys(['recommendationid', 'author', 'language', 'review', 
'timestamp_created', 'timestamp_updated', 'voted_up', 'votes_up', 
'votes_funny', 'weighted_vote_score', 'comment_count', 'steam_purchase', 
'received_for_free', 'refunded', 'written_during_early_access', 
'primarily_steam_deck', 'app_release_date', 'reactions'])

4. DateFrame 으로 변환

import pandas as pd

# 리뷰 데이터를 리스트로 변환
reviews_list = []

for review_id, review_data in review_dict['reviews'].items():
    reviews_list.append({
        'review_id': review_id,
        'review': review_data['review'],
        'voted_up': review_data['voted_up'],
        'playtime_hours': review_data['author']['playtime_forever'] / 60,
        'timestamp': review_data['timestamp_created']
    })

# DateFrame 생성
df = pd.DataFrame(reviews_list)
print(df.head())
   review_id                                             review  voted_up  \
0  223599133  그냥 재미가 없음. 스토리 텔링은 극세사로 채썰어놔서 집중도 안되고, 브금은 무슨 ...     False   
1  223593245  [h1] 재미 없네요.. [/h1]\n\n오리진 오디세이 예약구매하고 \n발할라도 ...     False   
2  223435854                                            조온나 재밌음      True   
3  223363922  역대 최고의 어쌔신 게임 !!\r\n오다 노부나가 세력에 맞서는 이가의 시노비 나오...      True   
4  223306698  처음에 말 많아서 이상할줄 알았는데 그정도는 아님 딱 어쌔신크리드 나름 잘 즐겼으면...      True   

   playtime_hours   timestamp  
0       60.083333  1776581732  
1       15.916667  1776574483  
2       88.750000  1776423349  
3      387.316667  1776335832  
4      143.050000  1776259893

5. 저장된 파일 다운로드

df.to_csv('reviews.csv', index=False, encoding='utf-8-sig')

from google.colab import files
files.download('reviews.csv')

주의사항

  1. 속도문제
    API 는 무제한으로 호출될 수가 없다.
    짧은 시간 내에 많은 요청에는 주의가 필요하다.
  2. 한국어 리뷰가 많지 않을 수 있다.
  3. Colab 런타임은 일정 시간 아무 활동이 없으면 끊길 수 있다.
    노트북 문서는 사라지지 않지만, 실행 상태 ( 메모리 ) 는 일정 시간 아무것도 안하면 사라질수 있다.

 

'🤖​AI Tools > AI 리뷰 분석' 카테고리의 다른 글

Hades 리뷰 분석  (0) 2026.04.22
API 로 데이터 수집 2  (0) 2026.04.22
데이터 수집 방법  (0) 2026.04.21
Python 정리  (0) 2026.04.21
텍스트 리뷰 분석  (0) 2026.04.14
'🤖​AI Tools/AI 리뷰 분석' 카테고리의 다른 글
  • Hades 리뷰 분석
  • API 로 데이터 수집 2
  • 데이터 수집 방법
  • Python 정리
DevHoChan
DevHoChan
맨땅에서 시작하는 코딩 도전
  • DevHoChan
    Debugging Life
    DevHoChan
  • 전체
    오늘
    어제
    • 분류 전체보기 (374)
      • 🕹️Game Life (1)
      • 🖥️Computer Science (5)
      • 📖TIL (141)
        • 🔥Projects (16)
        • 💡DevTips (5)
        • 🤔발생한 문제와 해결 (5)
        • 🔮Unity Graphics (5)
        • 🎤Interview (3)
        • ✅CodingTest (9)
      • 🚀Game Release (4)
      • 🧊Unity Basic (58)
        • 📌용어 사전 (1)
        • 에디터&인터페이스 (3)
        • 디버그 (1)
        • 라이프사이클 (4)
        • 게임오브젝트 (4)
        • 프리팹 (1)
        • 오브젝트풀링 (4)
        • 애트리뷰트 (2)
        • 트랜스폼 (4)
        • 물리&충돌 (1)
        • 프레임&델타타임 (4)
        • 코루틴&이벤트 (7)
        • 수학&보정함수 (3)
        • 디자인패턴 (9)
        • UGUI (3)
        • 벡터 ( Vector ) (3)
        • 씬 ( Scene ) (2)
        • 데이터 관리 (2)
      • ⭐C Sharp (99)
        • 📌용어 사전 (1)
        • 📌문법 사전 (6)
        • 메모리 관리 (3)
        • 00. 문법 (17)
        • 01. 변수 (3)
        • 02. 자료형 (2)
        • 03. 연산자 (6)
        • 04. 조건문 (2)
        • 05. 반복문 (2)
        • 06. 배열 (3)
        • 07. 메서드(함수) (7)
        • 08. 열거형 (3)
        • 09. 구조체 (2)
        • 10. 참조 (2)
        • 11. 객체 지향 (11)
        • 12. 델리게이트 (3)
        • 13. 디자인 패턴 (7)
        • 14. LINQ (1)
        • 📂▼자료구조 (2)
        • 15-1. 제네릭 (3)
        • 15-2. 배열 (4)
        • 15-3. 리스트 (2)
        • 15-4. 스택과 큐 (2)
        • 15-5. 딕셔너리 해시테이블 (2)
        • 15-6. 트리와 그래프 (3)
      • 📊Algorithm (16)
        • BigO (2)
        • 정렬 (4)
        • 셔플 (2)
        • 탐색 (6)
        • 최적화 (1)
      • 📝Game Design (16)
      • 🤖​AI Tools (12)
        • AI 리뷰 분석 (6)
        • Player2 (0)
        • 3D 모델링 (1)
        • 2D 스프라이트 (0)
        • 이미지 (2)
        • 사운드 (1)
        • 동영상 (1)
        • 문서 (1)
      • 🌍Network (6)
      • 🌱Github (11)
        • 기본 개념 (7)
        • 명령어 (1)
        • 도구 활용 (1)
      • ⚙️Visual Studio (5)
        • 🔧설치 및 환경설정 (2)
        • ⌨️HotKey (1)
        • 🚨디버깅 (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    문법
    OOP
    algorithm
    자료형
    CodingTest
    기획
    게임기획
    gamedesign
    부트캠프
    자료구조
    csharp
    c#
    unity
    객체지향
    게임디자인
    유니티
    디자인패턴
    GitHub
    메모리관리
    til
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.4
DevHoChan
API 로 데이터 수집하기
상단으로

티스토리툴바