데이터 스토리텔링
4. 데이터 스토리텔링 파트 2
서문
좋은 데이터와 통찰력 있는 스토리텔링은 직관적이고 강력합니다.
데이터 스토리텔링은 여러분의 분석적 발견을 효과적으로 전달하기 위해 필요한 예술적 투자라고 생각할 수 있습니다.
데이터가 영향력 있는 이야기를 하기 위한 핵심이라는 것을 모두가 알고 있지만, 청중이 공감할 수 있는 의미있는 이야기를 전하기 위해 이를 어떻게 이용해야 할지 이해하는 사람은 많지 않습니다.
이번 시간에는 우리의 메시지를 원하는 사람들에게 전달하기 위해 어떻게 데이터를 이용하는지 알아봅시다.
데이터 + 스토리텔링 + 디자인 = 데이터 스토리텔링
1. 데이터
데이터를 어떻게 얻나요?
1. 공개 데이터
- 미국인구조사국: 인구 데이터, 지리 데이터 그리고 교육을 포함한 미국 시민에 대한 방대한 자료
- 유럽 연합 개방형 데이터 포털: 정부 데이터를 볼 수 있는 또 다른 곳. 유럽 연합에 속한 기관에서 얻은 데이터를 기반으로 합니다.
- Datacatalogs.org: 또 다른 개방된 정부 데이터. 미국, 유럽 연합, 캐나다 및 기타 지역에서 온 데이터를 찾아 볼 수 있습니다
- NHS 보건 및 사회 복지 정보 센터 : 영국 국가 보건 서비스(NHS)의 보건 데이터를 이 데이터베이스에서 찾아 볼 수 있습니다.
- 아마존 웹 서비스 공공 데이터셋: 이 거대한 공공 데이터 자료는 1000 게놈 프로젝트와 NASA의 지구 위성 사진 데이터베이스를 포함합니다.
- 구글 파이낸스: 40년에 이르는 증권 시장 데이터로 이루어진 데이터베이스로 구글이 실시간으로 업데이트 합니다.
- 픽토차트 데이터베이스
2. 비공개 데이터
보고나 투명성 보장을 위해서는 내부 데이터(여러분 또는 고객의 데이터)를 모아야합니다.
- 페이스북 인사이트: 페이스북 팬 페이지에서 사용자 상호작용을 추적하고 분석하기 위한 도구입니다. 여러분의 페이스북 페이지 활동에 대한 소셜 미디어 리포트용으로 데이터를 모을 때 유용합니다.
- 메일침프 애널리틱스: 이메일 캠페인과 독자를 이해하기 위한 도구
- 구글 애널리틱스: 다양한 접점으로부터의 데이터를 분석하는데 사용할 수 있습니다. 웹사이트에 접근하는 트래픽에 대한 수치적 및 지리적 분석에서부터 사람들이 웹사이트와 상호작용하는 방법을 분석할 수 있습니다.
2. 스토리텔링
1. 트렌드 파악하기:
트렌드는 어떤 것이 변화하거나 발전하는 보편적인 방향을 가리키는 지표입니다. 당신이 데이터에서 찾아내야 할 것입니다. 아래의 트위터 그래프와 같이 단조로운 트렌드에서도 이야기를 전할 수 있습니다. “트위터가 어떻게 활성 사용자의 수를 늘리는데 실패하고 있는가” 와 같은 이야기가 될 수 있습니다.
2. 랭킹 이용하기:
랭킹은 리스트에 있는 항목 간의 관계에 대해 알려줍니다. 예를 들면 다음과 같습니다. 밴쿠버가 가장 살기 좋은 도시 리스트에서 2위를 차지하는 가운데, 비엔나는 계속해서 1위를 차지하고 있는가? 미국에서 다른 곳에 비해 범죄율이 높은 특정 지역이 있는가?
3. 비교하기:
비교는 양극단에 있거나 매우 비슷한 두 대상을 나란히 하여 이야기를 전달합니다. 트위터를 다시 예로 들어서, 페이스북의 급격한 성장과 비교할 수 있습니다.
4. 놀랍거나 반직관적인 데이터 찾기:
사람들이 진실이라고 알고 있는 이미 확인된 지식에 도전하는 데이터는 굉장한 이야기를 전합니다.
예를 들어서 팝 타트의 판매량이 허리케인 이전보다 7배 증가했습니다. 자연 재해를 예상한 사람들이 위안을 주는 음식을 찾은 것으로 보입니다.
5. 데이터 포인트간 관계 언급하기:
데이터 포인트 간의 관계는 여러 변수 간의 연관성 또는 상관관계를 보여줌으로써 이야기를 전합니다.
예를 들어서 비트코인 채굴 회사의 캐나다로의 유입은 지역 주민의 에너지 비용 인상으로 이어지고 있습니다.
3. 디자인
차트와 그래프
1. 도트 매트릭스 차트: 데이터 항목에 따른 분포와 비율을 빠르게 전달하고 싶을 때 사용합니다. 패턴을 찾고 있다면 데이터셋간 비교를 위해 사용할 수 있습니다.
2. 선 그래프: 하나 이상의 그룹에서 같은 기간 동안의 변화를 비교하기 위해 사용합니다.
3. 막대 그래프: 시간에 따른 데이터의 큰 변화를 보여주기 위해 사용합니다. 예를 들어서 북미 전역 도시의 전력비 비교가 있습니다.
4. 면적 차트: 하나 이상의 그룹의 시간에 따른 변화를 추적하기 위해 사용합니다.
데이터 프리젠테이션에 필요한 디자인 요소
스테파니 에버그린과 맨 이머리의 데이터 시각화 체크리스트에 따르면
- 비율: 독자가 자를 들고 그래프의 길이나 면적을 쟀을 때, 그 비율이 데이터 관계와 일치해야합니다.
- 색상: 여러분의 기관이나 고객의 브랜드 색상을 이용하면 좋습니다. 보조적이거나 덜 중요한 데이터는 지우거나 회색 처리합니다.
- 타이포그래피: 글자가 클수록 중요도가 높습니다. 텍스트는 수평이어야만 하고 인쇄용이면 9pt, 화면용이면 20pt를 사용합니다.
해야할 것과 하지 말아야할 것
- 아이콘을 이용하여 이해력을 증진시키고 너무 많은 라벨을 없애세요
- 값을 비교하기 쉽도록 데이터를 시각화하세요.
- 한 레이아웃에서 6가지 이상 색을 사용하지 마세요. 산만합니다.
- 3차원 차트를 사용하지 마세요. 데이터 시각화를 왜곡할 수 있습니다.
직접 데이터 스토리텔링을 해봅시다!
데이터를 통해 Flourish, 데이터 스토리텔링과 시각화를 위한 플랫폼을 사용할 겁니다.
설정
- 깃허브 저장소(https://github.com/lgellis/FlourishTutorial)에서 데이터 셋을 다운받습니다.
- Flourish beta에 가입합니다.
경마 차트를 만듭니다
- “시각화 만들기”를 선택합니다.
- “경마 차트”에서 “성적"을 선택합니다
- 차트의 이름을 입력합니다. 이 예시에서는 차트를 “1-위반 유형 경마”라고 부르고 “데이터"를 선택합니다.
- “데이터 불러오기"를 선택해서 깃허브 저장소에서 다운 받은 “Violation_Type_Summary.csv”라는 이름의 csv 파일을 불러옵니다.
- 이 예시에서는 “공개적으로 불러오기"를 선택합니다. (비공개로 하고 싶다면 계정을 업그레이드 해야합니다.)
- “점수 열"을 “C-H”로 수정합니다. (열 이름을 직접 입력할 수 있습니다.)
- 차트를 보기 위해서 “미리보기"를 선택합니다
- 차트 URL이나 내장 코드를 받으려면 “내보내기 & 발행하기"를 누릅니다
Demo 시연

- Untitled Story
https://public.flourish.studio
- 데모1
- Demo- Connections Globe
https://public.flourish.studio
- 데모2
결론
좋은 데이터와 통찰이 있는 스토리텔링은 직관적이고 강력합니다.
데이터를 어떻게 얻는지, 좋은 스토리텔링의 필요 조건, 그리고 이를 효과적으로 보여주기 위한 디자인 기술을 배웠습니다.
Flourish를 이용해서 실제 데이터 스토리텔링 연습과 시연을 했습니다. 디자인 기술과 데이터는 효과적인 메시지 전달에 중요하기 때문에 관련 서비스를 제공하는 서비스를 사용해보길 추천합니다.
참고자료

- Big Data: 33 Brilliant And Free Data Sources Anyone Can Use
https://www.forbes.com
- 포브스 리스트
- Welcome
|
European Union Open Data Portal
http://open-data.europa.eu
- 유럽 연합 개방형 데이터 포털
-
http://opengovernmentdata.org
- Datacatalogs.org

- Home - NHS Digital
http://www.hscic.gov.uk
- NHS 보건 및 사회 복지 정보 센터
- Registry of Open Data on AWS
http://aws.amazon.com
- 아마존 웹 서비스 공공 데이터셋
-
https://www.google.com
- 구글 파이낸스

-
https://piktochart.com
- 픽토차트

- Facebook for Business
https://www.facebook.com
- 페이스북 인사이트

- Integrate Google Analytics with Mailchimp | Mailchimp
https://mailchimp.com
- 메일침프 애널리틱스

- Analytics Tools & Solutions for Your Business - Google Analytics
https://www.google.com
- 구글 애널리틱스
-
https://datavizchecklist.stephanieevergreen.com
- 데이터 시각화 체크리스트

- Data_Visualization_101_How_to_Design_Charts_and_Graphs.pdf
https://cdn2.hubspot.net
-
https://www.columnfivemedia.com

-
https://www.nugit.co

- Data Storytelling: The Essential Data Science Skill Everyone Needs
https://www.forbes.com
- With the influx of data and self-service analytics tools, we're going to need more people capable of communicating insights effectively. The next generation of data storytellers will not be limited to just analysts and data scientists. Everyone will need to know how to tell a story with numbers.
-
https://www.littlemissdata.com
comment