

<Gephi를 활용한 데이터 시각화> 질문답변방
245명의 멤버가 함께하고 있습니다.
강의를 구매하시면 즉시 채팅방에 초대됩니다.


데이터의 시대입니다. 빅데이터라는 말이 생길 정도로 데이터는 어느 곳에나 있습니다. 그 많은 데이터는 어디에서 생길까요? 바로 "관계"에서 생성됩니다. SNS에서의 팔로우, 인터넷을 통한 사이트 접속, 재화의 거래, 메신저를 통한 의사소통, 협업을 통한 참여 등등, 소스는 아주 많죠.
우리는 관계에서 데이터를 얻습니다.
그리고 역으로, 그 데이터에서 실제 관계를 유추할 수도 있습니다.

세상이 복잡해지면서 그 관계들은 모두 통신망, 신경망, 사회관계망, 전력망, 거래망 등등 네트워크가 되어 얽히고 섥히게 되었습니다. 데이터 분석은 이런 복잡한 세상에서 미래를 예측하고 전략을 짜기 위해 등장했죠. 네트워크 분석은 그런 데이터 분석의 여러 분야 중 독특하고 매력적인 한 분야입니다. 어떤 Stuff와 Stuff의 관계에 대해서 뜯어보고 싶으시다면 네트워크 분석에 꽤 매력을 느끼실 겁니다.
곧 다가올 100년은 복잡성의 시대가 될 거라고 생각합니다.
- 스티븐 호킹, 2000년 1월.
우리는 이 강좌에서 Gephi라는 강력한 시각화 툴을 사용합니다. 이 툴은 데이터셋만 있으면 아무것도 모른 채로 바로 그럴듯한 결과물을 만들어낼 수 있을 정도로 강력합니다. 하지만 기능을 풍부하게 사용하고 결과의 맥락을 이해하려면 이론적인 바탕에 대한 기본적인 지식이 필요합니다.
데이터 분석은 이론적으로 깊이 들어가면 선형대수와 확률/통계가 뛰어노는 필드입니다. 하지만 이 강좌에서는 시각화와 분석에 초점을 맞출 것이고, 이론적인 부분은 직관적으로 이해할 수 있도록 수식을 최소화하면서 설명하겠습니다.

참고로 이 강좌에서는 데이터셋을 어떻게 마련하는지는 다루지 않습니다. 실습에 필요한 데이터셋은 강좌에서 제공해드립니다. 실제 본인의 데이터를 사용하고 싶으시다면 크롤링을 통해 얻으시거나 애널리틱스 툴에서 가져와야 합니다.
