스크랩/IT 방송기술

데이터(Data)를 좀더 효과적으로 보여줄 수는 없을까?

Flyturtle Studio 2011. 11. 9. 16:11
320x100


 텍스트 분석(Analyze a text)

리서치를 하면서 FGI,인뎁스 인터뷰,UT 등을 하게 되는데요~이 방법은 참가자들의 말을 기록한 스크립트 & 카드소팅(Card Sorting)을 통해 나온 참가자들의 연상 아이디어등을 분석하는 데 쓸 수 있겠다는 생각이 드네요~^^

----------------------------
1) 테그 클라우드(Tag Cloud)
2) Word Tree

----------------------------

1) 태그 클라우스(Tag Cloud)




- 소개 : 단어 사용 빈도를 시각화할 때 사용함
- 사용 데이터 : Free Text or Tabular Data
- 데이터 해석 : 크기가 클 수록 자주 나오고 중요한 단어임을 알 수 있음. 단어들의 열(Column)과 숫자들의 열의 관계성을 통해 단어간의 상관관계를 알 수 있음



2) Word Tree



- 소개 :  책,기사,발표문,시 등의 텍스트 분석을 통해 내가 찾은 단어가 어떤 상황문맥(Context)에서 사용되었는지 가지치기 형태로 보여줌
- 사용 데이터 : Free(Uncstructured) Text Data
- 데이터 해석 : 검색을 통해 단어가 쓰여진 여러 상황,상관 단어 등을 알 수 있음
   


 수치 비교(Compare a set of values)

----------------------------
1) 막대그래프(Bar Chart)
2) 블럭 히스토그램(Block Histogram)
3) 버블그래프(Bubble Chart)
4
) 매트릭스그래프(Matrix Chart)
----------------------------

1) 막대그래프(Bar Chart)



- 소개 : 수치 비교할 때 사용
- 사용 데이터 : Data Table Set
- 데이터 해석 : X좌표에 따른 수치를 Y좌표에서 보면 됨.

예시) 아래의 표는 그리스 신화에 등장하는 3가지 동물들의 수명을 기록한 Data Table입니다. 동물 종류에 따른 수명을 비교해보고 싶다고 가정하면 독립변인: 동물//종속변인:수명으로 생각하면 되겠죠? ^^ X좌표에 Animal이 표시되고 이에 따른 수명은 Y좌표에 표시되어 비교해볼 수 있겠습니다.

Animal(동물)      Lifespan(수명)   
    Gryphon               100                        
    Phoenix              1000                  
    Pegasus                50                  


2) 블럭 히스토그램(Block Histogram)




- 소개 : 수치 비교할 때 사용
- 사용 데이터 : Data Table Set
- 데이터 해석 : 블럭이 쌓인 것처럼 보이며 각 범위(Range)에 얼마나 많은 Value가 있는지 알 수 있음.

 
추가설명) 블럭 히스토그램은 줄기와 잎 다이어그램(Stem and leaf Diagram)과 같은 개념인데요. 쉽운 설명을 위해 하나의 예를 들어보겠습니다. 아래와 같이 숫자 10개가 있습니다. 이 데이터를 몇 개의 범위로 나누고 각 범위에 해당되는 데이터가 몇 개 있는지 알아보겠습니다.^^

3285 564 1278 205 3920
2066 604  209 602 1379

1) 범위(Range)를 나눕니다.

0 : 0~999
1 : 1000~1999
2 : 2000~2999
3 : 3000~3999

2) 각 범위에 해당되는 데이터의 첫째 자리수를 적어볼게요.

0 : 52616
1 : 11
2 : 2
3 : 33

3) 각 범위마다 도수의 개수 & 도수의 첫자리를 알 수 있겠네요.



3) Bubble Chart



- 소개 : 수치 비교할 때 사용
- 사용 데이터 : Data Table Set
- 데이터 해석 : 크기를 통해 데이터를 해석하는 데에 있어 태그 클라우드의 개념과 같으나 어디에 위치해 있는지는 중요치 않음. 주의할 점은 100과 -100은 동일한 크기로 표시됨으로 (+)와 (-)값은 색을 달리 표현해줘야 함.

예시) 이것은 앞서 예를 든 막대그래프의 예시를 다시 생각해보면 되겠네요...막대그래프로 표시하는 것이 아니라 원(Circle)으로 표시하면 되겠죠^^



4) Matrix Chart



- 소개 : 여러 수치를 통합하여 비교할 때 사용
- 사용 데이터 : Multidimensional Data Table Set

 예시) 아래의 데이터 테이블을 통해서 많은 그래프를 그릴 수 있는데요. 각 Land에 있는 후원자들이 후보자(Candidate)들에게 각각 얼마의 돈을 지원하고 하는지 알아볼 수 있겠네요.

Candidate Contributor Name Contributor Profession Land  Amount
Dumbledore            Potter             Student Hogwarts  1,000,000
Dumbledore          Granger             Student Hogwarts       1,000
Dumbledore            Krum        Quidditch Player Germany      10,000
Voldemort          Quirrell             Teacher Hogwarts       5,000



데이터 관계(See relationships among data points)


----------------------------
1) 네트워크 다이어그램(Network Diagram)
2) Scatterplot
----------------------------

1) Network Diagram


- 소개 : 데이터의 관계성을 보여줄 때 사용
- 사용 데이터 : Data Table Set
- 데이터 해석 : 각 단어와 관계있는 하위 구성 아이템들을 보면됨.



2) Scatterplot



- 소개 : 데이터의 관계성을 보여줄 때 사용
- 사용 데이터 : Multidimensional Data Table Set
- 데이터 해석 : 점 하나가 나타내고 있는 속성(X,Y 값)와 다른 점들과의 관계를 알 수 있음.

예시) 아래 자료는 2006년 도시별 인구 수에 따른 범죄발생건, 대학교 졸업인구 비율에 대한 데이터 입니다. X좌표에는 대학교 졸업인구 비율을 놓고 Y좌표에는 범죄 발생건을 넣어볼게요. 흩어 뿌려져 있는(Scatter) 점들의 크기는 인구 수에 따라 달라진다고 보면...대학교 졸업인구 비율에 따른 범죄 발생건 수가 어떻게 되는지 표시되는 것을 알 수 있겠습니다. 또한 각 도시의 인구와 함께 비슷한 위치에 있는 도시끼리 그룹핑도 할 수 있겠네요. 가령 포지셔닝 전략을 세울 때 이용될 수 있겠는데요? ^^


 도시     인구 수    범죄발생건     대학교 졸업인구비율  
 서울        1000M          3633                        28%                         
 인천         260M          3915                        15%

  부산          350M            3656                        22%
  대구          250M            3627                        15%
  광주          140M            2289                        13%
  대전          150M            1800                        25%


 구성비(See the parts of a whole)

----------------------------
1) 파이 그래프(Pie Chart)
2) Treemap
----------------------------

1) 파이 그래프(Pie Chart)



- 소개 : 데이터 간의 비율(Proportion)을 볼 때 사용
- 사용 데이터 : Data Table Set
- 데이터 해석 : 전체에서 각 데이터가 차지하고 있는 비율(%)를 봄


예시) 전체 인구에서 남/여 인구 수 비율

2) Treemap



- 소개 : 데이터의 관계성을 보여줄 때 사용
- 사용 데이터 : Data Table Set
- 데이터 해석 : 데이터가 어떻게 구성되어 있으며 속해있는 각 아이템의 크기와 명도에 따른 Value값을 봄

예시) 많은 데이터들은 계층구조(Hierarchical Structure)로 구성되어 있습니다. 아이템들은 카테고리,서브 카테고리로 나눌 수 있죠. 음식은 이름으로 구분하는 것 뿐만 아닌 종류에 따라 과일,고기 등으로 카테고라이징 할 수 있습니다. 이것은 Treemap을 구획? 지을 수 있게 해줍니다.^^ 아래 테이터를 통해 알 수 있듯이 판매량(Sales)에 따라 크기를 다르게 하거나 이익마진(Profit Margin)에 따라 색의 명도를 다르게 나타내 줄 수도 있겠네요~

Type Food Sales Profit Margin
Fruit Banana 1456 12
Fruit Lemon 23 -6
Fruit Orange 981 12
Meat Pork 111 2
Meat Beef 442 6
Meat Chicken 1456 77


 시간에 따른 변화추이(Track rises and falls over time)


----------------------------
1) 선 그래프(Line Graph)
2) Stack Graph
----------------------------

1) 선 그래프(Line Graph)


- 소개 : 데이터의 시간에 따른 변화를 보여줄 때 사용
- 사용 데이터 : Data Table Set
- 데이터 해석 : 각 아이템마다 시간에 따는 추이나 경향을 봄

예시) 아래와 같은 2005~2007년도 도너츠와 커피 가격에 대한 데이터를 활용하면 선 그래프를 그릴 수 있는데요. 아래와 같이 두 가지의 타입의 Data Table이 있을 수 있겠네요~^^

[Type1]

Year 2005 2006 2007
Price of Doughnut ($)          .75    .78     .81
Price of Coffee ($)         1.42   2.52    2.15

[Type2]

Year   Price of Doughnut ($)    Price of Coffee ($)
2005                .75           1.42
2006                .78           2.52
2007                .81           2.15

2) Stack Graph



- 소개 : 시간에 따른 누적된 데이터의 변화를 보여줄 때 사용. 대표적으로 기업의 각 제품에 대한 수익의 변화를 표현할 때 유용함. (-) 데이터는 사용할 수 없음
- 사용 데이터 : Data Table Set
- 데이터 해석 : 시간에 따른 누적된 변화 추이를 봄



출처 : http://uxcosmos.tistory.com/category/?page=3


320x100