본문 바로가기

스몰데이터

(2)
쓱-에서 물건을 구입하려면 목요일을 주시하세요 쓱-닷컴에서 자주 구입하는 카프리썬의 가격이 가끔씩 바뀌는 것 같았습니다. 특히, 주말보다는 주중의 가격이 저렴하다는 느낌을 얻기까지 했습니다. 하지만, 이는 어디까지나 '느낌'일뿐 누군가에게 설명하기에는 근거 데이터의 정리가 필요해 보였습니다. 그래서 그 '근거'를 얻기 위한 방법을 아래와 같이 진행해 보았습니다. 1. 쓱-닷컴의 카프리썬 가격을 수집하기2. 과거 가격은 와이프가 가계부에 기록한 카프리썬 가격을 가져와서 반영하기 즉, 가계부에 쓰인 카프리썬의 과거 가격들과 쓱-닷컴의 카프리썬 가격을 하루에 2번 정도 자동으로 가지고 와서 한 곳에 정리하여 모아 두고 그 변화의 추이를 그래프로 그려보는 것을 첫 목표로 잡았습니다. 가계부에는 약 2년간 기록한 카프리썬의 가격들이 있었지만 개수가 적었기에 ..
내가 재밌게 본 영화를 남들도 재미 있어 할까? 나는 대중과 취향이 같은 인간일까? 궁금했습니다. 즉, 내가 재밌게 본 영화가 다른 이에게도 재미있는 영화가 맞을지 그렇지 않을지에 대해서 말입니다. 그것을 어떻게 확인할 수 있을까를 생각하다 아래와 같이 머리를 짜내어 봤습니다. < 이 글은 빅 혹은, 스몰 (혹은, 초스몰) 데이터를 다루기 위한 전초단계부터 중, 후반의 단계에서 닥칠 상상해 볼 수 있는 문제들을 기술합니다. 즉, 왜 기존의 데이터들이 디지털 세상으로 이전되기까지 많은 시간이 걸리는지 혹은, 이미 디지털화되어 있는 데이터에 대해서도 새로운 인사이트로 인해 다른 방식으로 다루어지기까지 많은 시간이 필요한지에 대한 이유를 담고 있기도 합니다. 이쪽 계통과 좀 먼 분야에 계신 분들은 가끔씩 나오는 프로그램 코드의 이해를 건너 뛰고 읽어나가셔도..