CS공부/빅데이터_통계학기초

[포스코 AI·Big Data 아카데미 사전학습] 데이터사이언스를 위한 통계학입문 1-1

inji_ 2023. 5. 31. 15:27

아카데미 입과에 앞서 사전학습 목록이 공지되어 있어서, 관련강좌를 모두 듣기로 했다.

SQLD 자격증을 취득하면서 데이터 분석에 대한 부분에 대해서는 입문적인 공부를 했지만,

통계학과 관련하여 지식이 없기에 제일 먼저 수강하였다.

 

청년 AI·Big Data 아카데미 온라인 기초과정 (MOOC)

취업 준비생 누구나 POSTECH과 POSCO가 제공하는 무료 온라인 교육 과정에 참여할 수 있습니다.

pabi.smartlearn.io

위의 링크에서 관련된 강의를 누구나 무료로 들을 수 있다.

 

1-1 데이터 과학과 통계

  ① 데이터 과학이란 무엇인가?

   

    DATA ANALYSIS을 통하여 INSIGHT를 창출하는 것

    

    DATA ANALYSIS란?

    •  데이터 큐레이션 : 데이터 추출 및 변환 (SQL, R, Python)

    •  데이터 시각화 : 그래픽( R의 ggplot)

    •  통계모형, 인공지능

 

  ② 통계가 상식이 된 사회 

    •  통계는 올바른 의사결정을 돕는다.

  ③ 데이터 분석과 윤리

    •  데이터의 정직성이 중요

    •  어떤 데이터는 신뢰할 수 없는가?

      - 데이터 잘못 수집했을 때

      - 데이터 잘못 보관했을 때

    •  데이터는 어떻게 추출해야 하는가? (좋은 데이터의 기준!)

      - 대표성/ 비편향성/ 랜덤 

 

  공유 데이터와 오픈 소스

    •  공유 데이터란? 정부 및 공공기관 등이 제공하는 단순 측청치의 데이터

    •  오픈 소스란? 지적 창작물을 공유한 것

      - 주로 개인이 깃헙에 올리고 공유