전체상품목록 바로가기

본문 바로가기



현재 위치
  1. 게시판
  2. 오늘의 핫뉴스

오늘의 핫뉴스

오늘의 핫뉴스 게시판입니다.

게시판 상세
제목 [산업분석] 합성데이터에 대한 분석
작성자 산업경제리서치 (ip:)
  • 평점 0점  
  • 작성일 2023-02-21 16:47:42
  • 추천 추천하기
  • 조회수 13

□ 목차

  Ⅰ. 풍요 속 빈곤, 쓸 수 있는 데이터의 부족

  Ⅱ. 합성 데이터의 부상과 AI 기술의 발전

  Ⅲ. 정책 이슈 및 시사점


 

□ 요약

 

◇ 인공지능은 데이터를 먹고 자란다
인공지능을 만들기 위해서는 데이터를 학습시켜야 하며 데이터를 학습시키기 위해서는 인공지능이 이해하는 양질의 데이터 확보 필요
그러나 양질의 데이터를 수집 가공 정제하기 위해서는 천문학적인 비용과 시간이 소요될 뿐만 아니라 개인정보 저작권 등의 문제 애로
데이터 라벨링 시간과 비용을 절약하고 데이터 품질을 제고하기 위해 많은 기업은 오토라벨링 솔루션을 도입하는 추세
데이터 라벨링 자동화는 기존 방식 대비 작업 시간과 비용을 대폭 줄여줄 수 있으나 쓸만한 데이터 확보의 문제를 해결해주지는 못함


◇ 데이터 확보, 무엇이 문제인가?
다음과 같은 문제로 인공지능 학습을 위한 데이터 확보에 어려움
데이터양 부족 학습에 필요한 데이터양은 천문학적으로 증가 하고 있으나 비용과 시간의 한계로 확보할 수 있는 데이터 규모 제한
양질의 데이터 부족 저작권 개인정보 보호 특수 도메인 라벨러 확보 데이터 편향성 등의 문제로 양질의 데이터 확보 애로
롱테일 데이터 부재 발생하지 않았거나 발생 빈도가 낮은 다수 사건 등 현실에서 구하기 어려운 데이터 존재 

 

◇ 인공지능 모델 성능은 100%로 충분한가?
현재 인공지능은 학습 데이터의 수량 및 품질 테스트 조건과 훈련 분포의 일치 정도 등에 따라 모델의 우수성이 좌우됨
따라서 다수 발생하는 사건에 대해서는 시간과 비용이 충분하다면 양질의 데이터 확보 및 가공을 통해 우수한 인공지능 모델 개발 가능
그러나 통계적 머신러닝 모델은 학습 데이터가 없는 이벤트에 대해서는 예측 능력이 현저히 떨어져 인공지능 서비스 시 리스크 우려


◇ 없으면 만들어 쓴다
데이터 구축 시 한계인 수량 품질 보안 속도 등을 극복하기 위한 대안으로서 임의 생성된 가상 데이터인 합성 데이터 가 부상
합성 데이터 란 실제 데이터 의 대체재로서 컴퓨터 시뮬레이션이나 알고리즘을 통해 생성하는 임의의 데이터
 

화면 캡처 2023-02-21 152106.png


전체글보기

첨부파일
비밀번호 수정 및 삭제하려면 비밀번호를 입력하세요.
댓글 수정

비밀번호 :

/ byte

비밀번호 : 확인 취소

댓글 입력
댓글달기 이름 : 비밀번호 : 관리자답변보기

영문 대소문자/숫자/특수문자 중 2가지 이상 조합, 10자~16자

/ byte

왼쪽의 문자를 공백없이 입력하세요.(대소문자구분)

회원에게만 댓글 작성 권한이 있습니다.


장바구니 0