서울 서대문구 데이터바우처 사업관리 가공기업
서울 서대문구 에는 임팩터블, 마켓링크, 디아이랩(주) 외 4개의 가공기업이 있습니다.
임팩터블 소개
- 임팩터블은 2022-06-03에 설립되었습니다.
- 주소 : 서울 서대문구 간호대로 35 2층
- 주요 서비스 : [ 데이터 분석 및 가공 서비스 ]
– 기업 별 1:1 상담을 통한 맞춤형 데이터 분석 및 가공 전략 수립
– 상세페이지 전략 기획 및 카피라이팅
-시장 조사 / 상품 분석 / 판매 전략 수립 / 상세페이지 카피라이팅 기획
– 스마트스토어 최신 로직 기반 종합 분석 및 세팅
– 상품명 / 속성 / 카테고리 / 키워드 / 태그 등 세부 항목에 대한 분석 및 관리
– 키워드 분석, 스마트스토어 분석, 유료광고 분석, SEO(검색엔진최적화) 분석, GA 분석
– 성과 분석 및 리포트 제공 - 보유 솔루션 : [ 보유 기술 ]1, 빅데이터 기반 마케팅 지표 확립2.
데이터 분석을 위한 분야별 전담 인력3.데이터별 성과 지표 분석 및 가공을 위한 노하우[ 솔루션]1.
전문화된 마케팅 분석 솔루션 보유2.
개발 인력을 통한 데이터 분석 프로그램 활용 및 지속적인 업데이트 진행3.
클라우드 활용을 통한 결과물 제공 기반 마련4.
기업 내 운영 소통 채널을 통한 고객 응대5.
데이터 분석 및 가공을 위한 전문 솔루션 보유 - 품질 확보 전략 : 1.
최적의 전략 수립을 위한 내부 데이터 확보
– 고객정보 등이 담긴 CRM 자료 및 판매 정보가 담긴 매출 등 기업 보유 데이터 활용
– 고객의 취향을 예측한 제품 및 콘텐츠를 기획하고 추천
– 충성 고객을 관리하고 잠재 고객을 발굴하는 등 당사만의 노하우가 담긴 전략 수립2.
수행 및 분석을 위한 외부 데이터 확보
– 고객이 기업의 제품/서비스를 구매하고자 의사 결정을 내리는 과정 추적
– 포털 사이트에 남기는 연관 검색어, 검색량 등과 같은 수많은 흔적 데이터 수집
– 시장 및 소비 트렌드, 브랜드 포지션을분석하고 고객 만족도를 측정
– 마케팅 전략 수행 과정 전체에서 광범위하게 사용3.
신규 인력 채용
– 신규 인력 채용을 통한 데이터 품질 유지 확보 방안 마련
– 기존 전문 인력을 통한 신규 인력 데이터 분석 관련 교육 진행
– 품질 유지를 위한 데이터 가이드 지표 확립4.
데이터 컨설팅 진행
– 서비스 및 제품에 맞는 데이터 결과물 제공을 위한 기업별 데이터 컨설팅 진행
– 데이터 품질 유지를 위한 기업의 기존 홍보 데이터 분석
– 컨설팅 진행을 통한 분석 방안 마련5.
데이터 수요 조사
– 원하는 분야의 데이터 분석을 위한 고객별 데이터 수요 조사 진행
– 수요를 통한 집중적인 데이터 분석 설계
– 세부 데이터 설계를 통한 높은 품질의 데이터 결과물 도출 - 유지보수 전략 : 1.
제공 목표
– 기업별 서비스 및 제품 특성에 맞는 데이터 분석 결과 제공
– 엑셀 및 구글 시트를 통한 결과 보고서 전달2.
기업 및 데이터별 특성에 맞는 마케팅 컨설팅 진행
– 데이터 사용 방법에 대한 전반적인 가이드라인 제공3.
유지 보수
– 불확실한 데이터에 대한 유지보수 6개월 무상 진행
– 각 데이터별 유지보수에 대한 가이드 제공
– 유지보수를 통한 신규 컨설팅 및 효율적인 광고 세팅 지표 제공4.
고객 관리 및 응대
– 당사가 운영 중은 카카오톡 채널 등을 통한 빠른 소통 및 응대
– 고객 관리 전문 인력을 통한 세부적인 계획 방안 안내 - 카테고리 구분 : 시각화,분석
- 실적 : 2022년 데이터 분석 및 가공 건수 57건
- 기업 개요 및 핵심역량 : [ 기업 개요]
– 당사는 데이터 분석 전문가, 마케터, 디자이너로 구성된 데이터 마케팅 전문 기업[ 핵심 역량 ]
– 기업 별 맞춤 데이터 분석을 통해 최적화된 전략 수립
– 전략 기획, 이행, 성과 측정까지 비즈니스 단계 전반 데이터 마케팅 수행
– 빅데이터 기반 의사 결정 프로세스 보유 - 활용 사례 :
마켓링크 소개
- 마켓링크은 2011-02-09에 설립되었습니다.
- 주소 : 서울 서대문구 경기대로 15 4층
- 주요 서비스 : 1) 데이터 전처리 및 품질개선
– 입수 데이터의 포맷, 필드값(레코드), 분포 및 기초통계치 확인 등 데이터 식별
– 활용에 불필요한 결측치, 극단치 등의 부정확한 값을 제거하는 데이터 정제
– 일부 레코드를 사전에 정의된 내용으로 뽑아내는 데이터 추출
– 데이터 결측치를 합리적인 방법에 의한 값으로 채워 넣는 데이터 대체
– 활용에 필요한 항목을 외부데이터로부터 결합하는 보강 및 융합
– 필드의 모든 값을 주어진 전제나 가정에 의해 일괄적으로 변환하는 보정
– 적은 수의 관측치(데이터) 필드를 많은 수로 구성된 필드의 구축 단위에 맞게 늘리는 투영
– 활용 목적에 맞는 구축단위로 데이터(필드)를 줄이는 데이터 요약
– 필드에 구성된 모든 값을 활용목적에 맞도록 정해진 규칙에 의해 바꾸는 변환
– 특정 데이터의 가공작업을 위해 다른 데이터 내용을 활용하는 참조
– 가공된 결과 데이터의 오류 확인 및 개선하는 검증
2) 시각화/대시보드
– 지도, 그래프, 차트, 분석 대시보드로 변환하여 시각화 처리
– 개발프로그램에 적합한 데이터로의 변환, 데이터 커스터마이징
– 사용자 편의성을 고려한 UI 작업
– 화면설계 및 디자인
– 제공데이터 현행화, 데이터 보정 등 유지보수
– 인터넷이 가능하다면, 언제 어디서든 주요 지수의 Summary Report를 쉽고 빠르게 분석 가능
– 다양한 형태의 테이블과 차트를 통해서 분석 결과를 이해하기 쉽고 효과적으로 전달
– 제품군, 주요 지수를 트리 구조로 설계하여 분석 항목을 쉽고 빠르게 찾을 수 있고 one
-click으로 주요 지수를 한 눈에 파악할 수 있는 효율적인 인터페이스 구성 - 보유 솔루션 : ○마켓링크는 빅데이터 가공에 필요한 기술 및 자체 개발 솔루션을 보유가공 솔루션특징 소개텍스트마이닝앱 로그데이터, SNS 데이터 등 비정형데이터의 키워드 분석 특성 및 분석 솔루션다양한 분야의 카테고리별, 키워드별 등 조건별 데이터 추출 기능키워드 등록 및 분석 기능크롤링웹(인터넷, 모바일) 페이지의 특정 영역 정보, URL 정보 등의 데이터 구축 솔루션웹페이지 크롤링 로직 구현, 클로링 정보 수집, 분석결과 시각화 기능공간정보가공GIS기반 좌표부여/변환, 공간정보 분석 솔루션데이터와 위치좌표값 결합 및 지도상의 표현, 공간매핑 및 공간분석 기능시각화/대시보드가공한 데이터를 지도 그래프, 차트, 히트맵, 밀도뱁 등 대시보드 형태 구현 솔루션사용자 편의성을 고려한 UI 작업, 커스터마이징 디자인/퍼블리싱데이터 분석 솔루션분석모델 알고리즘을 적용/구현한 데이터 분석 솔루션스크립트 기반의 예측, 유형화, 연관성 분석 등 분석결과 도출 기능추천모델, 시뮬레이션, 예측/추정 모델링 가능앱 사용분석 솔루션앱 사용의 다양한 행동을 통합적으로 분석하는 솔루션다양한 분야의 앱 사용에 대한 현황 및 앱 사용자에 대한 프로필 정보 제공 기능대시보드/전자리포트 형태로 서비스 기능구매행동분석솔루션웹 상에서 소비자가 쇼핑/구매하는 행동데이터 분석 솔수션행동패턴 분석 정보 제공 기능.
대시보드/전자리포트 형태로 서비스 제공 마케팅 전략 수립을 위한 큐레이션 서비스 기능 커스터마이징 가능디지털 뉴스기사 열독률 분석솔루션웹 상에서 언론매체(포털, 신문사)의 뉴스/기사의 데이터 분석 솔수션신문사, 신문기사 기준의 열독률 분석.
대시보드/전자리포트 형태로 서비스 제공 인구통계학적 정보 및 세부적인 지표 제공타겟 트렌드 분석솔루션고객 및 소비자가 선호하는 장소, 제품, 인물 등 시의적으로 트렌드 분석 솔루션텍스트마이닝 및 크롤링 기능 탑재비정형데이터 분석, 시계열분석, 분석결과 시각화 가능서베이머신온라인 조사 질문지 제작 툴 및 솔루션데이터 수집을 위한 대시보드, 커스터마이징 기능파싱, 웹 페이 - 품질 확보 전략 : □ 가공서비스 제공, 유지보수, 고객관리 및 고객 대응 계획 ○ 고객관리 및 고객대응과 품질관리 및 유지보수를 위한 업무기획팀을 별도 운영 ○ 데이터 가공/분석팀과 데이터 솔루션 개발팀은 가공서비스 제공에 있어 결과의 고품질과 개선 및 유지보수에 집중할 수 있도록 별도 조직으로 운영 ○ 데이터 판매부서와의 유기적인 업무 협조 체계 ○ 바우처 사업규모 확대에 따라 탄력적으로 인력을 변동시킴으로써 수요기업의 요구사항을 가공 단계 및 유지보수 단계에서 원활히 적용될 수 있도록 전사적으로 지원
□ 가공 기술인력 업무능력 향상 지원 ○ 기술인력의 자격증 획득 및 온/오프라인 교육 수강 지원 ○ 회사 내 멘토링 제도 및 스터디그룹 학습을 통한 기술공유 및 획득 유도 ○ 기술인력의 성과에 대한 인센티브 제도 시행중
□ 외부 수요 증가에 따른 대응 계획 ○ 지속적인 데이터 가공서비스 인력 확보 추진
– 추가 인력 확충을 통하여 가공서비스 수요기업 증가에 대한 수요 대응
– 가공서비스 제공 증가에 따른 탄력적 인력 운영.
가공유형에 따른 팀별 추가 인력 확보
– 현재 각 부서별 신규 인력 채용(외부 공고) 진행 중 ○ 협력 관계가 이미 확보된 대학 및 자문 교수진과의 협의를 통하여 기본 기술력을 보유한 인력 확보 추진 ○ 신규 가공인력의 업무적응력과 전문성을 높이기 위한 교육체계 수립 ○ 기존 내부 인력의 가공 기술력 향상을 위한 사내 및 외부 교육으로 데이터 가공 능력 강화 ○ 가공 업무 업무 프로세스 전반에 대한 체계적인 방법론 수립 및 적용 - 유지보수 전략 : □ 수요기업 대상 상담 및 컨설팅 제공 계획 ○ 당사 기존 중소기업 고객들을 대상으로 데이터바우처 지원사업 참여를 위한 홍보 및 안내와 한국데이터산업진흥원에서 진행하는 매칭데이에 참여하여 수요기업과 상담 및 컨설팅 진행 ○ 수요기업에 대해 전화상담 및 방문 인터뷰를 통해 수요기업이 데이터 가공을 통해 원하는 목적을 정확히 파악하고 필요할 경우 사전 컨설팅 서비스를 제공
– 최초 Contact : DataStore 포털 및 당사 홈페이지의 Q&A 기능을 통해 신속한 질의/응답
– 1차 상담 > 수요기업이 상담을 원할 경우 전화나 이메일로 상담을 진행 > 수요기업의 데이터 활용 목적, 활용분야, 최종서비스 등 기본적인 사항들을 파악
– 방문 인터뷰 > 1차 상담을 통해 컨센서스가 이루어지면 수요기업을 직접 방문하여 인터뷰를 진행 > 수요기업의 구체적인 목적 파악.
데이터 가공서비스 비용과 업무기간 등에 대한 협의 ○ 업무기획팀과 데이터 가공업무 부서가 각 업무단계별로 수요기업과 상담 및 컨설팅 진행 ○ 업무기획팀 (2명
-빅데이터본부 본부장, 빅데이터 솔루션 개발본부 부사장)
– 빅데이터 가공 및 분석, 컨설팅 경험이 풍부한 전문인력이 수요기업 상담 시 초기 대응
– 수요기업과 사전협의 시 수요기업의 비즈니스모델 수립을 위한 컨설팅 제공 ○ 가공업무팀
– 수요기업의 요구사항이 정확히 반영될 수 있는 요건협이 상담, 컨설팅 제공
– 수요기업 요구 시 가공 진행 단계에서 관련 기술 및 내용에 대한 교육, 컨설팅 제공
– 가공 결과 보고 및 리뷰.
수요기업 보완 요구사항 및 개선사항 반영 커뮤니케이션
– 사업 완료 후에도 수요기업의 비즈니스 적용을 위한 사후 지원 컨설팅 ○ 고객관리 및 고객응대
– 기본적인 문의사항은 DataStore 포털 Q&A 기능을 활용하여 질의/응답
– 당 - 카테고리 구분 : 전처리,품질,코딩,시각화,정보추출또는조합,태깅또는라벨링,분석,기타
- 실적 : 연번수행연도사업명발주처가공업무(적용기술)12019.3Pharmacist Insight Panel Diary한국아이엠에스헬스데이터 표준화 및 시각화22019.3AppPlus Web Report 개발나이스디앤알데이터 가공/분석 및 시각화32019.4태양광 배송/설치 인바운드 프로그램 개발리서치랩데이터 표준화 및 시각화42019.5온라인 보고서 마스터 개발GFK데이터 가공/분석 및 시각화52019.7데이터 마이그레이션, 대쉬보드 개발 및 유지관리이노션데이터 표준화 및 시각화62020.1HCP Insighr Panel 관리 시스템 개발한국아이엠에스헬스데이터 표준화 및 시각화72020.2병원 CSI 시스템 개발SEMA데이터 표준화 및 시각화82020.9국가혁신클러스트(R&D)
-피부건강을 위한 맞춤형 화장품 서비스 플랫폼 개발산업통상자원부데이터 표준화 및 시각화92020.12축산물 소비정보 분석 시범운영을 위한 용역축산물품질평가원데이터 표준화 및 시각화102021.2배송안내 CTI 특정 우편번호 최우선 콜 기능 추가리서치랩데이터 가공/분석 및 시각화112021.32020 직장어린이집 설치의무이행 실태파악을 위한 웹사이트 설계육아정책연구소데이터 표준화 및 시각화122021.4유통데이터 기반의 공급망 기술 실증 지원산업통상자원부데이터 표준화 및 시각화132021.5주요 양식수산물(광어) 소비정보 데이터 서비스한국해양수산개발원데이터 표준화 및 시각화142021.8MZ세대 모바일 다이어리 개발리서치하우스봄데이터 표준화 및 시각화152021.11유통데이터 기반의 공급망 기술 실증 지원 TMR데이터 가공/분석 및 시각화162021.12온라인데이터가공및분석데이터앤솔루션데이터 가공/분석 및 시각화172022.5소비자 상품/거래정보 기반 유통데이터 마케팅 인텔리전스 솔루션 개발중소기업기술정보진흥원데이터 표준화 및 시각화182022.6디지털유통물류기술개발 및 실증지원한국산업기술평가관리원데이터 가공/분석 및 시각화192022.62022년 제주도민 일자리 인식실태 조사 진행현황 입력 - 기업 개요 및 핵심역량 : ○ 데이터 수집, 가공, 분석, 시스템 구축, 컨설팅을 제공하는 데이터 비즈니스 전문기업
– 마켓링크는 데이터수집, 데이터가공, 데이터분석 및 시스템 구축, 빅데이터 컨설팅까지 데이터 관련 전 분야에 있어 역량, 전문성, 기술을 갖춘 데이터 비즈니스 전문기업
– 마켓링크가 자체적으로 개발한 방법론 및 솔루션을 활용하여 공공 및 민간에서 필요로 하는 데이터 상품 및 서비스를 제공하고 있음
– 데이터 비즈니스를 위한 인프라와 환경, 다양한 시스템 솔루션 개발의 지적재산권을 보유하고 있는 독창적인 데이터 전문기업
– 지속적인 경영혁신과 기업문화 발전을 위한 노력으로 서울 강소기업, 기술혁신형 중소기업, 경영혁신형 중소기업, 성과공유기업 등 다양한 기업인증 획득 ○ 빅데이터 서비스 사업 영역
– 마켓링크의 빅데이터 서비스 사업 영역은 데이터 판매 및 상품개발, 데이터 가공, 데이터 분석 및 컨설팅, 빅데이터 솔루션(시스템 및 시각화)개발로 구분 > 데이터 판매/유통 및 상품개발 : 마켓링크가 자체 구축한 앱 관련 데이터의 판매/유통 서비스 제공.
고객 보유데이터 및 공공데이터 등 이종(異種)의 데이터와 자사 보유데이터의 융복합을 통한 새로운 가치의 데이터 상품 개발 및 유통 (한국데이터산업진흥원의 데이터바우처 지원사업을 통해 데이터 판매를 진행 중이며, 한국정보화진흥원 빅데이터 플랫폼 사업을 통해 개발한 산림인구 데이터도 데이터 바우처에 등록하여 판매 중임) > 데이터 가공 서비스 : 고객이 자체 보유하고 있는 데이터를 고객이 활용할 수 있도록 정제, 전처리, 추출, 변환, 분석, 시각화(대시보드) 등의 일련의 가공업무 전반을 수행 > 데이터 분석 및 컨설팅 서비스 : 고객이 보유한 데이터를 근간으로 분석 주제 발굴 및 비즈니스 방향 수립을 위한 컨설팅 및 분석 시나리오(설계) 업무와 모델링, 다변량 분석 등 분석 주제와 방향에 부합하는 통계 분석/보고 업무를 - 활용 사례 : 1) 일반가공(온라인 유통 트렌드 지표분석을 위한 가공 분석) ○ 수집된 온라인 쇼핑몰(쿠팡, 옥션 등)에서 유통되는 1년에 천만 건 이상의 상품 유통 트렌드 데이터를 표준화 ○ 데이터 가공 진행 (분석DB) 분석DB 적용 활용변수 정의 및 기준 수립, 데이터 정제/변환 분석 (분석 모델링) 분석활용 변수 정의 및 모델링, 지표 구축(가중치 부여 등) 분석방법론 적용 (분석결과 시각화)분석결과 시각화 범위선정 및 기획, 분석결과 시각화 구축 ○ 가공 데이터를 활용한 분석서비스 및 시각화 제공 웹 기반 서비스 구축을 통한 데이터에 대한 쉽고 빠른 접근성 제공 주기적인 리포트 생산으로 유통 트렌드에 대한 현행화된 컨설팅 서비스 유통 카테고리별 데이터 생산으로 맞춤형 분석 서비스 제공 이러한 서비스는 추후 상품 제조사 및 유통사 등 제품 관련 기업과 리서치 회사, 컨설팅 회사 등 컨설팅 서비스 기업에서 수요가 예상됨
2) AI가공(AI학습데이터 구축을 통한 화장품 추천 서비스 개발) ○ 수집된 35,796개 화장품 이미지를 AI학습용 DATA로 구축하여 AI기반 소비자(고객)가 사용하는 화장품을 카테고리별로 분류한 후, 고객에게 효과가 좋은 제품을 추천서비스 개발 ○ 가공서비스 Process ① 원천 데이터 확보
– 35,796개 화장품 이미지 데이터와 화장품 브랜드, 카테고리, 제품명 등의 정보를 포함하고 있는 엑셀 데이터
– jpg, png 파일 형식의 이미지는 추후 소비자가 업로드한 제품 카테고리 분류를 위한 학습용 데이터셋으로 활용
– 화장품 속성 정보가 포함된 엑셀 데이터는 제품 분류 작업 또는 추가적인 정보 제공 과정에서 활용 ② AI 학습용 데이터셋 구축
– 소비자가 업로드한 이미지 분류 작업을 위해서는 사전에 학습용 데이터셋 구축 작업이 선행되어야 함
– 학습용 데이터셋
디아이랩(주) 소개
- 디아이랩(주)은 2020-03-19에 설립되었습니다.
- 주소 : 서울 서대문구 경기대로 47 진양빌딩 302호
- 주요 서비스 : 품질검사 : IoT 센서 관측 변수에 대한 통계 및 AI 모델 구축 및 고품질 데이터 생산수치모델자료 가공 : NetCDF/GRIB/HDF 등의 포맷으로 되어 있는 수치모델 RAW 데이터를 차트 기반 가시화, 포인트 자료 추출, 기계학습 기반의 통계처리(사용언어 포트란, 파이썬 등)학습데이터 생성 : 관측자료, 위성자료, , 레이더, 수치모델자료를 가공하여, 딥러닝 학습데이터로 재가공.
결측치에 대한 Gap
-filling 수행환경기후자료 처리 : 관측자료, 위성자료, 레이더, 수치모델자료에 대한 포맷 변환, 포인트 값 추출, 차트 기반 가시화.산업데이터와 융합분석:관측자료, 위성자료, 레이더, 수치모델자료 등 기상환경 데이터와 산업데이터를 활용한 산업별 맞춤형 융합분석 및 AI 모델 개발 - 보유 솔루션 : 인공지능 기반 예측 및 이상감지 솔루션 디아이캐스트(DI CAST)ㅇ 디아이캐스트는 디아이랩의 도메인 전문성과 축적된 기후환경 데이터, 그리고 인공지능 기술을 기반으로 기후환경분야에 최적화된 이상감지 및 예측 솔루션을 제공합니다ㅇ 인공지능 기반 이상감지 솔루션
-이상감지 요소 : 미세먼지, 온습도, 일사량, 태양광 발전량, 소음, 진동 등
-기후환경 도메인 지식을 기반으로 이상감지 요소에 따라 AI 모델을 설계하고 학습하여 센싱 데이터의 이상 여부를 판단
-AI 모델과 함께 물리적, 통계적 기법을 추가 적용하여 이상감지 성능을 향상ㅇ 인공지능 기반 예측 솔루션
– 예측 요소 : 미세먼지, 온습도, 일사량, 태양광 발전량 등
– 다양한 데이터(관측, 위성, 레이더, 수치모델 등)를 통합 분석하여 학습 데이터 구축
– 예측 요소와 예측 목적에 맞는 피처엔지니어링 및 최적 모델을 선택
– 과거 데이터 학습을 통해 모델을 최적화하고 지속적으로 모델을 업데이트하여 최고의 성능을 유지 - 품질 확보 전략 : 1.
고객 요구분석부터 가공결과 제공까지 체계적인 업무 프로세스 정립을 통한 품질 안정화
– 상담, 컨설팅 부분은 유선/메일/미팅을 통해서 진행
– 수요기업의 데이터 가공 요구사항 파악 후, 개발 프로그램에 대한 설계 진행
– 설계 문서를 바탕으로 수요기업의 요구사항 만족 여부 검토
– 주기적인 보고 및 협의를 통해 개발/가공 자료에 대한 요구사항 만족 여부 검토
– 향후 고도화 방안 도출2.
신규인력(기상/딥러닝) 채용 및 교육을 통한 내부 리소스 확보 및 역량강화3.
전담 유지보수 인력 배치를 통한 서비스 품질 안정화 - 유지보수 전략 : 1 수요기업과의 충분한 논의를 통해 수요기업에 맞는 최적의 데이터 수집/가공 서비스 계획 수립 및 설계진행2 설계 결과에 대한 수요기업 설명을 통해 추가 및 보완사항 반영 후 가공 수행3 주기적인 미팅을 통한 고객 피드백 반영4 최종 결과 만족도 점검 및 보완 요구사항 반영5 외부 수요 증가에 대응하기 위해서 기본적으로 모든 프로그램은 솔루션 기반으로 개발하여 인력 투입을 최소화6 전담 유지보수 인력 배치를 통한 안정적 후속 지원 및 유지보수
- 카테고리 구분 : 전처리,품질,코딩,시각화,정보추출또는조합,분석
- 실적 : 순번 사업명 발주처 사업연도 1 IoT 센서 데이터 분석 환경과학기술 2020 2 서비스 플랫폼 기반 미세먼지 예보정확도 향상 문제 해결기술개발 R&D 정보통신기획평가원 2021
-2022 3 기후환경 데이터 분석 및 가공 환경과학기술 2021 4 AI 기반 예측 알고리즘 적용을 통한 공장내 공기질 스마트 케어 서비스 개발 정보통신산업진흥원 2022 5 태양광발전 통합 모니터링 시스템 개발 기상산업기술원 2022 6 스마트 드론 윈드길 및 도시 열정보 지도 서비스 기술개발 수도권기상청 2022 - 기업 개요 및 핵심역량 : 디아이랩은 대한민국 기상예보사 1호인 대표이사가 확보하고 있는 미세먼지, 폭염, 집중호우 등 환경기후 분야의 도메인 전문성과 SK플래닛, KT 등의 기업에서 쌓은 IoT, AI, 데이터분석, 플랫폼 기술을 바탕으로 기후환경의 영향을 받는 다양한 공공 및 산업분야에 탄소중립과 ESG 경영을 지원하는 데이터 인텔리전스 서비스 제공합니다.디아이랩의 핵심 기술은 아래의 세 가지 입니다.1.
인공지능 기반 IoT 센서 이상감지 기술통계 및 인공지능 기술을 이용한 센서 데이터의 장애, 외부영향, 이상패턴 탐지 기술2.
인공지능 및 수치모델을 활용한 기상/환경 하이브리드 예측 기술이상감지 기술을 통해 정제된 센싱데이터와 기상/환경 수치모델 데이터에 인공지능 기술 적용을 통한 하이브리드 예측기술3.
기상/환경과 타 분야 데이터의 매쉬업 분석을 통한 Data Intelligence 플랫폼 기술기상/환경 데이터와 인구/행정/보건데이터 매쉬업 분석을 통한 미세먼지/폭염 등 기후환경 사회문제 대응 기술기상/환경 데이터와 산업 데이터 매쉬업 분석을 통한 날씨경영 지원 기술주 사업 영역은 미세먼지, 폭염 등 기후변화 대응이 필요한 지자체 등 공공 및 보건 영역과 날씨에 따른 에너지 소비예측 및 태양광/풍력발전량 예측을 기반으로한 EMS(에너지관리시스템)영역, 날씨에 따른 변화가 큰 계절가전/의류 등 유통영역, 그리고 안전 운행을 위해 위험기상정보가 필수적인 자율주행(차량, 드론, 선박)영역 등이 있습니다. - 활용 사례 :
코드비전(주) 소개
- 코드비전(주)은 2018-11-10에 설립되었습니다.
- 주소 : 서울 서대문구 연세로 50 연세대학교 공학원 B187L
- 주요 서비스 : 1.
코드비전 가공 서비스 범위코드비전 가공 서비스는 매우 다양한 데이터에 대해 적용 가능합니다(
1) 1차원 데이터소리 데이터 가공 시 해당 데이터에 어떤 특징점이 특정한 상태를 나타내는지 영역에 대해 라벨링(
2) 2차원 데이터이미지 데이터 가공 시 특정 부위를 라벨링하는 것으로 객체 혹은 객체의 특정 부위를 식별바운딩박스, 세그멘테이션 등 다양한 표현 방법이 있어 수요기업의 니즈에 맞춰 여러 형태로 가공 가능(3) 2차원 + 시계열 데이터동영상 데이터 가공 시 해당 동영상이 어떤 의미를 가지는지부터 동영상의 특정 위치가 가지는 의미까지 라벨링객체의 추적이나 상황인식에 사용 가능(4) 산업용 AI 데이터다양한 산업에서 사용되고 있는 관측 및 계측 장비에 대한 데이터 수치 및 이미지를 기반으로 특정한 의미를 도출하여 데이터 라벨링(5) 맞춤형 AI 데이터기존에 정의되지 않은 다양한 형태나 특정 상황 및 공간에 대한 작업도 수요기업의 요청사항에 맞춰서 작업 가능2.
코드비전 가공 서비스 절차코드비전 가공 데이터는 다음의 6단계 절차를 거쳐 수요기업에 전달됩니다.(
1) 가공 의뢰수요기업에서 제작하고자 하는 인공지능의 형태, 기능, 범위에 관련된 내용을 종합하여 의뢰(
2) 데이터 설계코드비전의 인공지능 전문인력이 수요기업의 니즈를 분석하여 인공지능 학습에 필요한 데이터를 설계(3) 협의수요기업의 니즈와 공급기업의 설계가 같은 방향을 향해 가고있는지 확인데이터 형식 및 산출물의 규모를 협의(4) 가공협의된 내용을 바탕으로 가공 작업자를 대상으로 프로젝트에 대한 교육 실시 및 가공(프로젝트의 이해가 높은 작업자일수록 데이터의 오류가 줄어들기 때문에 필수 과정)(5) 검수협의된 내용에 따라 작업된 가공 데이터를 검수 담당자가 꼼꼼히 확인하여 가공 서비스의 품질 확보불량한 데이터가 나오면 재가공 후에 수요기업에 전달(6) 완료검수까지 완료된 데이터들은 수요기업으로 전달되어 최종 확인이 때 발생하는 미흡사항들은 무상유지보수를 통해 품질 향상 - 보유 솔루션 : 1.
코드비전 보유 솔루션다양한 가공 기술세그멘테이션바운딩박스오브젝트 키포인트 등코드비전 자체 가공 플랫폼고객사의 요구사항에 맞는 가공 기술을 효율적으로 적용 가능하도록 가공 플랫폼 커스텀그 외 데이터 취득/정제/가공에 필요한 장비 및 SW - 품질 확보 전략 : 1.
코드비전 데이터 품질 검수 프로세스코드비전의 데이터 품질 검수 프로세스는 최초 데이터 설계 시 작성된 작업 가이드를 바탕으로 다음의3단계를 거쳐 진행됩니다.(
1) 샘플 데이터 검수작성된 가이드 기반으로 가공 플랫폼을 커스터마이즈하면서 데이터 협의 사항에 대한 형식 및 오류에 대해 확인(
2) 가공 데이터 검수완성된 커스텀 가공 플랫폼을 활용해 작업자가 데이터를 가공한 후 가공이 잘못되었거나 모호한 데이터 등을 선별하여 재확인(3) 수요기업 데이터 검수공급기업에서 검수가 완료된 데이터를 수요기업에서 재차 검수 요청위와 같이 가공을 위한 매 과정에서 검수를 진행하는 것으로 수요기업과 협의된 품질 기준을 충족하는 데이터를 완성합니다. - 유지보수 전략 : 1.
코드비전 데이터 유지보수 계획대상물데이터바우처 사업으로 인해 발생한 가공 데이터 산출물유지보수 범위수요기업
-가공기업
-진흥원 간 체결한 3자 협약에 포함된 사전 협의서에 따라 정의된 내역과 그 이후 상호 협의 하에 수정된 내용을 포함유지보수 기간무상 하자보수 기간: 계약 이행 종료 후 6개월간유상 하자보수 기간: 무상 하자보수 기간 만료 후 6개월간유지보수 내용구분내용무상 유지보수대상공급한 목적물에 하자가 있는 경우 무상 하자보수를 원칙으로 함협약 종료 후 6개월 이내 발생하는 데이터 결함에 대한 유지보수 지원내용무상 유지보수 기간동안 일어나는 유지보수 활동데이터 작업물에 대해 오류 혹은 미흡한 점에 대한 보수 작업 진행사전 협의 내용을 따르니 않는 작업물에 대한 보수 작업유상 유지보수대상무상제공 범위를 벗어나는 데이터 추가 제공 등에 대한 활동사전 협의되지 않은 추가 데이터 업무내용신규데이터 추가, 기존 데이터 구성 변경 등 실시할 경우상호 협의하여 실비 제공을 원칙으로 함금액작업량에 비례하여 투입 인력에 대한 금액 발생 - 카테고리 구분 : 전처리,품질,코딩,시각화,정보추출또는조합,태깅또는라벨링,분석
- 실적 : 1.
코드비전 실적2021년데이터바우처 지원사업 우수기업선정2021년AI바우처 지원사업 우수기업선정국내 1553개 인공지능 기업 중 상위 1% 내 (8위)(링크)우수기업 선정 인터뷰 영상2023년 데이터바우처 지원사업 공급기업 재선정(4년 연속)2023년AI바우처 지원사업공급기업 재선정(4년 연속)ICT R&D 혁신 바우처 지원사업 공급기업 선정 (2021년~ 2년 연속, 진행중)데이터바우처 지원사업 공급기업 선정 (2020년~ 3년 연속, 완료)AI바우처 지원사업공급기업 선정 (2020년~3년 연속, 완료)2021년 벤처기업 승인2021년 조선해양산업기술개발사업 조선소 관련 사업 선정(링크) 코드비전 실적(연혁) - 기업 개요 및 핵심역량 : 1.
코드비전 소개코드비전은 2018년에 설립된AI 기반의 영상 솔루션 전문 기업입니다.영상 데이터를 기반으로 한 인공지능 솔루션 및 VR, AR 등의 응용기술을 보유하고 있습니다.검출, 인식, 추적, 재인식, 감시, 분석 부분에서 세계 최고 기술을 제공하는 기술개발전문기업으로의 성장이 목표입니다.주요 사업분야안전, 헬스케어, 제조, 모빌리티 등 다양한 산업 영역에 최신 AI 기술 및 최적의 데이터 솔루션 제공(링크)코드비전 소개2.
코드비전 핵심 역량개별 맞춤 데이터산업현장의 니즈를 파악해 데이터 설계부터 정의, 구축, 가공까지 최적의 데이터 솔루션 제공인공지능 전문 기업다년간의 인공지능 실적 및 경험을 바탕으로 최적의 데이터 컨설팅 제공코드비전 자체의 AI 원스톱 솔루션고객사의 요구사항에 맞게 데이터, AI, 운영플랫폼 모두 제공인공지능 운영플랫폼을 이용해 지속적인 데이터 분석 및 AI 모델 업그레이드 가능 - 활용 사례 : 1.
코드비전 고객사례운동 데이터셋 구축 및 가공 (22,500건)모바일 기반 언택트 운동 코칭 서비스를 제작하기 위한 운동 데이터 구축 사례인체의 주요 부위를 18포인트로 나누어 정의하고 그에 따라 이미지의 관절 위치 라벨링(링크)2023 데이터바우처 판매상품 [헬스장 기구 운동 10종 이미지
– 키포인트 데이터 셋]모빌리티 실내환경 데이터셋 구축 및 가공 (15,684건)차량 내부 환경에서 반려동물의 움직임을 추적하고 운전자의 상태 관찰 시스템을 구축하기 위한 데이터 구축차량 내부에 카메라를 설치하여 반려동물과 운전자의 데이터를 수집하고, keypoint와 bounding box 형태로 가공(링크)2023 데이터바우처 판매상품 [차량 실내 반려동물 이미지
– 바운딩 박스, 키포인트 데이터셋]골프 영상 데이터 가공 (20,000건)각 이미지에 바운딩 박스, 세그멘테이션, 오브젝트 키포인트에 대한 어노테이션을 진행하여 총 20,000여건의 이미지 데이터 가공전력설비 초음파 데이터셋 구축 및 가공 (10,000건)전력 설비 초음파 신호를 기반으로 고장판별 인공지능을 개발하고자 데이터셋을 구축전력 설비의 초음파 신호 대역을 분석하여 범위를 정하고, 대역별 특성을 파악하여 고장 유형 라벨링(링크) 코드비전 고객사례
(주)보아라 소개
- (주)보아라은 2018-09-07에 설립되었습니다.
- 주소 : 서울 서대문구 연세로 50 연세공학원 230호
- 주요 서비스 : (
1) 유통용 가명정보/익명데이터의 데이터 품질 지표 측정 서비스 ㅇ 데이터 판매사가 보유한 원본데이터를 가명처리 또는 익명처리하여 가공한 유통용 판매 데이터의 안전성(개인재식별도/개인추정도)과효용성(원본유사도)에 대한 객관화된 정량적 지표 값을 본사가 보유한 AnonyTester를 이용하여 측정한 결과를 판매데이터의 객관적인 가치 척도로 활용할 수 있도록 제공
– 판매 데이터의 법적 안정성과 활용 효용성에 대한 객관적이고 정량적인 지표 값을 잠재적 구매자에게 제공하여 판매 데이터 제품의가치 및 가격 산정 협상에 활용 => AnonyTester: 원본데이터를 유통용으로 가공한 판매데이터에 대해 국내 개인정보보호법의 준수 여부를 측정하는개인재식별도/추정도 및 원본유사도 지표 값을 전수적으로 측정하고 상용화한 세계 최초 제품임 ㅇ 지표 측정 가공 업무 프로세스 : 계획수립 : 원본데이터 D와 이를 유통용으로 가공한 가공데이터 D’ 준비 ② 가공데이터의 안정성/효용성 지표 측정 (AnonyTester 실행)
– 개인재식별도: 가공데이터 D’의 유일 속성조합 값을 원본데이터 D에서 동일한 값울 유일하게 가져 특정 개인을 재식별하는유일성 레코드의 가공데이터의 레코드 비율
– 원본유사도: 원본데이터D의 속성 값과 가공데이터 D’의 대응 속성값 간의 평균 차이 비율
– 개인추정도: 원본데이터 D의 속성 값과 가공데이터의 D’의 속성 값 차이가 임계치 보다 작은 속성들을 갖아서 특정 개인을유츄 가능한 레코드의 비율 ③ 지표 측정 결과 보고서 작성 및 제출 (
2) 활용 목적에 따른 다수준 익명처리 가공 서비스ㅇ 원본데이터 또는 가명정보에서 유사한 N명의 레코드를 1개의 대표레코드로 추상화 기법을 통해 익명처리하여 원본데이터의 어느 개인도 익명처리된 가공 데이터에서 재식별되지 않도록 익명처리한 판매 데이터 제품을 생산→판매데이터의 개인재식별도==0이고 원본유사도가 90% 이상인 개인추정도<;70% 이내의 익명데 - 보유 솔루션 : – 본사의 3개 제품 MASQ와 AnonyTester, DATAMASQ은 데이터 판매기업의 원본데이터를 가공하여 최종 수요기업에 전달되는일련의 과정을 데이터의 품질(안정성 및 효용성) 가치를 객관화하여 제공하는 기능적 역량 보유
– 세계 최초 독자 기술로 익명처리 관련 3개 제품으로 구성된 익명 활용 종합 제품군 확립(<;표5>)
– 본사의 익명처리 제품MASQ는 작업자의 전문성에 따라 MASQ
-self, MASQ
-lite, MASQ
-full로 구성되고 이중 MASQ
-self는DB나 IT 지식이 없는 사용자가 스스로 단순 클릭 작업만으로 익명처리 가능 제품이며 MASQ
-full은 대용량 데이터 처리용임.
– 다양한 익명처리 제품군 제공: 수요기업과 제공기업의 다양한 요구 사항에 적합한 제품군 보유 (전문가용: MASQ
-full, 일반사용자용: MASQ
-lite, 초보자용: MASQ
-self) 순번제품명제품 상세 기능1MASQ(Nulti
-level Abstraction&Synchronization) 원본데이터를 차분프라이버시 기술로 다수준 추상화된 익명 재현데이터 생성 개인식별자에 대한 익명식별자 생성/익명식별자기반 익명결합 수행
– 일반인용(MASQ
-self), 전문가용(MASQ
-lite), 대용량처리용(MASQ
-full)
– 지원 사양:오라클/마이라DBMS, CSV 화일2AnonyTester 가명정보/익명 재현데이터 품질(익명성/효용성) 자동화 측정 (개인재식별도/개인추정도, 원본유사도 데이터 가치 품질 지표 정량적 산출)3DATAMASQ 클라우드기반 판매데이터 소재정보 및 익명데이터 유통 고속도로 솔루션 판매데이터 소재정보 공유: 판매 데이터의 잠재적 고객 발굴 및 매칭 서비스 익명 재현데이터 발행: 보유 데이터의 익명화 유통/판매
– 제품종류: 개방형(Public), 분야 및 개별 기업용(Private)<;표5> 본사 제공 제품군
– 다른 제품(AnonyTester, DAT - 품질 확보 전략 : ㅇ N명의 유사한 실제개인 레코드들을 한 명의 가상개인 레코드로 그룹핑하여 집계하는 추상화 개념을 적용하여 원본데이터를 완벽한 익명 재현데이터로 가공ㅇ 가공데이터의 법적 안전성/효용성 가치 지표 측정을 통한 객관화
– GDPR의 익명정보 정의
– 익명성을 정의하는 4가지 안전성 지표 a.
개별화식별 가능성 측정 지표: 전체데이터에서 특정 개인 레코드의 식별 가능한 정도 b.
추론 가능성 측정 지표: 개별화가 아니어도 속성값으로 특정 개인을 유추해 낼 수 있는 정도 c.
구별 가능성 측정 지표 : 추론이 안되어도 특정 개인의 레코드를 구별할 수 있는 정도 d.
연결 가능성 측정 지표; 동일한 값 연결을 통하여 특정 개인을 식별하는 정도
– 가공데이터의 안전성 지표의 전수적 측정 (개별화식별 가능성, 추론 가능성, 구별 가능성, 연결 가능성 측정) a.
개별화식별 가능성 측정 지표: 개인재식별도 측정 (= 0 보장) b.
추론 가능성 측정 지표: 개인추정도 측정 (추정 임계치 이하로 자동 보정) c.
구별 가능성 측정 지표 : 추상화(N) 및 차분프라이버시 입실론 지원 d.
연결 가능성 측정 지표; 익명식별자 및 익명결합
– 가공데이터의 효용성 지표: 원본유사도 및 잔존률 측정
– 가공데이터의 측정 실험 결과(비교 <;표3> 예시)<;표3> 가공데이터의 안전성/효용성 측정결과사용모델원본유사도(%)잔존율(%)재식별도(%)개인 추정도(%)δ=90%,θ=90%δ=95%,θ=95%δ=99%,θ=99%KLTKLT(K=3, L=2, T=0.5) 90.0187.7594100100100K
-익명성(K=3)66.1888.020000MASQ고수준 추상화 (N=3)98.4593.23081581저수준 추상화(N=10)96.992.84059251 (데이터 출처: UCI Machine Learning Repository, Censu - 유지보수 전략 : ㅇ 제공기업의 판매데이터의 정량적 품질 및 가치 객관화 측정 지표 제공
– 연속된 신규 발생 판매데이터의 지속적인 후속 가공 업무 지원 체계 마련
– 익명처리 (가명처리) 데이터의 효과적인 분석 지원
– 데이터 품질 및 데이터 가치 측정을 통한 판매데이터의 제품군 다양화 ㅇ 익명데이터의 결합활용을 위한 지속적인 수요기업 매칭 지원 ㅇ 법/제도 및 기술 관련 익명처리 전문가팀을 구성하여 다양하고 심도있는 컨설팅 유형 제공
– 전문가기반 안전성/효용성 최적화를 통한 고품질 익명데이터 생성 과정
– 안전한 익명데이터 유통 컨설팅
– 홍보용 맛보기 익명데이터 가공 컨설팅 ㅇ수요기업이 제공기업과 함께 결합전문기관을 통해 공식적인 가명/익명 적정성 평가를 진행할 때 가명처리 데이터 또는 익명처리 데이터의 안정성/효용성에 대한 객관화된 픔질 보고서 지원 ㅇ 다양한 교육 채널 및 방식 지원
– 익명처리 작업 녹화 동영상 제공, 실시간 온라인 교육, 1:1 실시간 온라인 헬프, 오프라인 방문 ㅇ 제공기업의 판매데이터 소재정보 홍보 및 수요기업 매칭을 위한 클라우드 서비스 제공
– 판매데이터 소재정보 공유허브를 통해 잠재적 수요기업의 적극적인 발굴 및 홍보
– 판매 제공기업을 대상으로 고활용성 익명데이터 판매 제품화 홍보 - 카테고리 구분 : 기타
- 실적 : – ‘21년도에 한국지능정보사회진흥원(NIA)에서 주관하는 빅데이터플랫폼센터 30개 참여사의 53개 원본데이터를 본사의 익명 재현데이터 제품인 MASQ로 가공하여 활용
– ‘22년도 한국지능정보사회진흥원에서 주관하는 빅데이터플랫폼센터 참여사의 50개 원본데이터를 본사의 MASQ 제품으로익명 재현데이터로 추가로 가공/활용
– ’22년부터 한국도로공사에서 진행하는 국토부 교통데이터 플랫폼의 안심구역에서 재현데이터 활용을 위해 본사 익명처리 제품MASQ와 유통플랫폼 제품 DATAMASQ를 사용하여 구축 진행
– 통계청은 7월부터 ‘2019년
-2020년 기업통계기록부DB 4천만 건을 본사의 MASQ 제품으로 익명 재현데이터를 생성하고 있으며 이를’23년도에 통계청 공공데이터로 개방할 예정
– 한국지능정보사회진흥원은 ‘23년에 판교 빅데이터센터에 “익명 재현데이터 안심구역”을 개설하기 위해 올해 본사가 재현데이터의 법률 검토, 익명성 검증 벤치마킹 실증을 진행하고 있으며 본사의 익명처리 제품 MASQ, 가명성/익명성 측정 제품 AnonyTester, 유통플랫폼 제품 DATAMASQ을 모두 이용하여 재현데이터 안심구역 이용자 프로세스를 정립하고 있음.<;표2> 유사 사업 실적순번기관명과제명계약기간1한국도로공사국토 교통데이터 산업생태계 플랫폼 구축 사업2022.04~2025.122한국지능정보사회진흥원 빅데이터 플랫폼센터 가명정보 활용지원 사업 2022.06~2022.123한국지능정보사회진흥원 빅데이터 플랫폼센터 가명정보 활용지원 사업 2021.07~2021.124정보통신기획평가원비식별화기법을 이용한 개인정보보호기술개발 2019.02~2019.05 - 기업 개요 및 핵심역량 : ㈜보아라는 개인정보의 완벽한 익명처리를 통해 자유로운 익명데이터 고속도로의 실현을 목표로 2018년 설립된 빅데이터 기술 전문 회사입니다.
원본데이터에서 개인정보를 완벽하게 익명처리 가공하여 자유로운 유통이 가능한 익명 재현데이터를 생성하는 자체 기술을 최신 프라이버시 기술기반으로 개발하여 해외 특허(등록:2,출원
1)와 국내 특허(등록:3, 출원
1)을 보유하고 있으며 이를 기반으로 GS 인증 1등급, V&V 인증 및 조달청 우수제품인증을 획득한 익명처리SW 제품(MASQ)을 상용화하고 고활용성 익명데이터를 안전하게 유통하는 유통 플랫폼 서비스(DATAMASQ)를 제공하고 있습니다.
또한 가명정보 및 익명 재현데이터의 안정성(개인식별도/개인추정도)과 효용성(원본유사도/잔존율) 지표를 자동화 검증하는 SW 제품인 AnonyTester는 가명/익명 적정성 평가에서 객관화된 정략적 지표를 제공하여 개방용 또는 유통용 데이터의 개인정보 유출 위험과 데이터의 활용 가치를 객관적인 판단 기준을 제공하는 유일한 제품입니다.
– ‘20년 개인정보보호법의 개정으로 공익 목적으로 원본데이터를 가명처리하여 공인 결합전문기관을 통해 가명정보의 결합 활용 합법화하였으나 가명정보의 적정성 평가 기준이 모호함
– 정부는 민간데이터 유통을 위해 데이터바우쳐 사업 등을 통해 국내 데이터의 유통 활성화를 진행하고 있지만 강력한 국내 개인정보보보법의 제약사항으로 통계성 또는 집계성이 아닌 고활용성 개별 레코드 단위 익명데이터의 개방 및 유통 활용 미비 → 본사의 AnonyTester를 이용하여 원본데이터를 가공한 결합용 가명정보와 유통용 재현데이터/익명데이터의 정량적인 품질 지표(재식별위험도, 원본유사도 등) 값을 측정하여 데이터 판매자와 수요자간 객관적인 정량적 가치평가에 따른 유통 판매 지원
– 본사의 익명처리 제품인 MASQ을 이용하여 데이터 판매자가 의뢰한 원본데이터를 유통 목적에 적합한 익명 수준의 익명데이터로 가공하여 안전하게 수요기업에 제공
– 본사의 DATAMASQ 클라우드 - 활용 사례 : (
1) 유통용 가명정보/익명데이터의 데이터 품질 지표 측정 서비스
– 가명정보 판매 데이터에 대한 결합전문기관의 가명정보/익명정보 적정성 평가를 수행할 때 가공데이터에 대한 객관적인안정성 및 효용성 품질 척도로 결합전문기관에 제공
– 익명정보 가공데이터의 데이터 안전성 및 가치 지표 산정 (
2) 통계청 기업통계등록부(2019년 2020년) 4천만건을 저수준/고수준 MASQ 데이터로 가공 진행
– 2023년 공공데이터 개방 예정(<;표6>)<;표6> 통계청 기업통계등록부 가공 결과 (원본데이터: 4천만건)통계청 : 기업통계등록부(SBR)_2019,2020년: 고수준/저수준 추상화 생성 결과원본 데이터 셋추상화 타입추상화 크기연결형타입원본유사도(%)잔존율br_2019고수준3Json91.2494.78최빈값91.16저수준10Json84.8194.3최빈값85.89br_biz_2019고수준3Json91.6695.55최빈값91.56저수준10Json85.5994.43최빈값86.54br_2020고수준3Json92.6993.68최빈값92.52저수준10Json87.3593.7최빈값92.9br_biz_2020고수준3Json82.2695.41최빈값92.12저수준10Json86.6194.14최빈값87.58생성 결과의 평균값88.9394.49 (3) 익명 재현데이터(MASQ)의 원본데이터 대비 분석 효용성 검증 결과 (2021년 한국지능정보사회진흥원 과제)
– 검증 모델 : 원본데이터와 원본데이터를 추상화 익명화한 MASQ 데이터에 각각 동일한 분석 모델을 적용한 후 두 분석 결과 비교 <;표7> 원본데이터와 MASQ 가공데이터의 데이터분석 결과 비교* K
-means데이터명데이터구분응집도분리도설문 문항별 통계데이터원본 데이터43601151고수준 추상화4390(+0.69%)1154(+0.26%)* Random Forest데이터명데이터구분정확도정밀도재현율F
-measure설문 응답자별 통계데이터원본 데이터77%73.97%79.71%76.42
나이스디앤알 주식회사 소개
- 나이스디앤알 주식회사은 2008-05-01에 설립되었습니다.
- 주소 : 서울 서대문구 충정로 36 국민연금관리공단빌딩 7층
- 주요 서비스 : Dmoa 스크래핑 서비스 : 기업 회계/금융 업무를 지원하는 기초데이터 수집 서비스○ 나이스디앤알 서버에 인증정보를 등록하여 데이터를 수신하는 방식 (서버스크래핑) ○ 수집된 데이터는 나이스디앤알 서버에 저장되며, 고객사는 수집된 자료만 수신하는 방식 ○ Batch 파일형태로 제공 (매일) ○ 세금계산서, 현금영수증, 은행거래내역, 카드이용내역 등 기업회계, 세무신고 기초 데이터 수집 ○ 내부 시스템 연계를 위한 수집 데이터의 최적의 자료 제공 ○ 고객사 시스템과 유연한 통합 기능 구현 가능○ API방식 데이터 연동 채널 제공 : 고객사 환경에 최적화된 API 맞춤형 개발 지원
- 보유 솔루션 : 안정적인 자체 IDC센터 및 인프라 서비스 운영○ 국내 업계 최고의 독자 IDC 센터 설비체계 및 전산시스템을 구축하여 안정적이고 효율적인 서비스를 제공○시스템의 이중화 구상과 상시 모니터링 체계를 통하여 상시적으로 안정적인 운영관리○ IT서비스 운영, 인력관리 등 ISO20000 이상으로 지속적인 서비스 품질관리○ 첨단의 전원 및 공조시스템 운영(IDC센터 운영)○ IDC센터 출입자에 대한 보안관리 체계를 통하여 엄격한 통제○ IT장비의 효율적 운영 및 유지보수 운영
- 품질 확보 전략 : 1) 품질확보 전략Optimal Plus 관리방법론 활용서비스 운영에 필요한 요소를 10가지로 분류하고 각각의 체계적인 기능을 수행함으로써 효율적으로 서비스 품질확보 및 품질유지를 실현
2) IDC센터 운영나이스그룹 자체 IDC(Internet Data Center)보유 (서울특별시 강동구 상일로 6길 55)대내외계 모두 철저한 보안관리 및 안정적 품질성능유지를 위한 전문인력 24시 상주 중3) IDC센터 정기 보안감사이미 영위중인 데이터 가공 사업으로 인한 금융기관 및 그룹 정기보안감사 수행 중: 분기단위, 연단위 수행 - 유지보수 전략 : 1) 수요기업 지원 및 협업 전략핀테크/스타트업 지원 프로그램 가동체계적 사업관리 및 오프라인 스타트업 지원 시스템 운영으로 사업목표 달성
2) 수요기업 응대 계획CRM센터 가동수요기업 요청사항 및 민원사항 대응 전담 배치/운영 ○ CRM센터운영 : 이용기업의 요구사항과 문의 대응을 위한 전문 운영센터 확보 (현재 3명의 서비스 지원 인력 근무 중) ○ 역할에 따른 수행 프로세스순서이름/직위 업무수행역할비고1김*룸/매니저대고객 커뮤니케이션수요고객 요청사항 (민원포함) 접수CRM 담당자에게 전달즉시2고*화/책임장*은/책임CRM수요고객 요청 분석 수요고객 요청사항 분석,요청사항 분류(품질, 이상, 보완, 불편),필요시 수요고객과 추가 커뮤니케이션 진행담당자에게 전달1시간 내3한*택/책임허*종/책임상품운영 및 모니터링서비스 이상반응 점검서비스 이상점검이상상황 모니터링 및 조치24시간 내4김*빈/책임데이터 품질관리, 서비스 품질유지공급데이터 품질 확인, 서비스유지 현황 파악 및 조치24시간 내5이*호/책임상품기획, 품질확보개선사항반영, IT연동관리고객 보완요구사항, 추가기능개발 사항 파악기획 및 개발 반영 검토1개월 내○ 24/365 Alert 시스템 운영 (디지털혁신본부) : 시스템 SW/HW 이상발생시 24시간 365일 담당자 및 유관부서, 관계자에 즉시 알람. - 카테고리 구분 : 정보추출또는조합
- 실적 : 1)지**시스템(주) 공급계약 체결 · 사업내용 : 지**시스템 Dmoa 서비스 업무제휴 계약 체결 (‘20.10월) · 거래처명 : 지**시스템(주) · 계약기간 : 1년 (자동연장조건 有) · 사업금액 : 약 80백만원/年 · 성과 : 지**시스템(주)는 중소벤처기업부에서 지원하는 비대면 바우처 정부지원 사업공급기업으로 당사의 Dmoa 서비스를 사용하여 회계프로그램 운영.
2)신***컴 공급계약 체결 · 사업내용 : 신***컴Dmoa 서비스 업무제휴 계약 체결 (‘20.10월) · 거래처명 : (주)신***컴 · 계약기간 : 1년 (자동연장조건 有) · 사업금액 : 약 12백만원/年 · 성과 : 국내 최대 의약품유통ERP업체로, 의약품 유통사들의 금융거래를 수집하여 ERP를 통해 통합 제공하기 위하여, Dmoa서비스를 적용하여 시범 운영하였음3)코**랩 ‘21년 데이터바우처 가공서비스 제공 · 사업내용 : 영세 화물운송사업자를 위한 금융 및 세무정보 지원서비스 (‘21년) · 거래처명 : (주)코**랩 · 계약기간 : 1년 · 사업금액 : 약 44백만원/年 · 성과 : 화물정보망시스템과의 연계를 통해 회원으로 가입 된 약3만5천명의 회물운송사업자를 대상으로 서비스를 제공하여 세무신고 기초자료 등 제공 4)스**젯 ‘22년 데이터바우처 가공서비스 제공 · 사업내용 : 의약품 및 의료기기 유통 도소매 사업자를 위한 금융 및 세무신고 지원 서비스 (‘22년) · 거래처명 : 스**젯 · 계약기간 : 1년 · 사업금액 : 46,500,000원/年(VAT 포함) · 성과 : 의약품 유통 ERP 시스템과 연계를 통해 1차로 약 700사(스**젯 회원사)를 대상으로 세무신고 기초자료를 제공 하는 서비스를 제공하며, 향후 타 의약품 유통 ERP사와 제휴를통해 의약품 및 의료기기 유통 도소매 사업자 전체 에 대해 세무신고 기초자료를 제공하는서비스를 제공하고자함 - 기업 개요 및 핵심역량 : 1) 기업개요나이스디앤알(NICE Data & Research)은 국내 최고의 금융인프라 그룹인 나이스그룹의 자회사로 자체 Smart Data 서비스를 활용한 각종 솔루션 및 수준 높은 리서치 서비스를 제공합니다.
2) 주요 사업 분야 및 주요 연혁 [주요 사업 분야] ○ 동반성장 사업 : 대중소기업간 상생협력을 통한 동반성장 지원 .
협력사 체불예방 시스템 (노무비닷컴)
– 금융시스템을 활용한 선제적 협력사 체불 예방 .
동반성장 평가지원 시스템 (나이스윙크)
– 국내 유일, 협력사 간의 공정거래를 지원 .
전자 입찰·계약시스템 (나이스다큐)
– 입찰과 계약 솔루션을 관리하고 지원 ○ 데이터 기반 기업경영지원 사업 : 소상공인 사업자와 기업을 지원하는 기업경영지원 솔루션 .세무지원시스템 : 세무데이터의 수집/가공을 통해 사업자/소상공인의 세무업무를 지원 .
법인업무지원시스템 : 금융데이터의 수집/가공/관리/모니터링을 통해 기업의 비용절감,업무리소스의 재분배,기회비용의 재생산, 업무프로세스의 개선등을 지원 .
데이터인프라 시스템 : 기업 및 사업자, 소상공인들이 필요로 하는 다양한 데이터를 고객의요구에 맞추어 수집 및중개 ○ 리서치 사업 : 비즈니스이슈 해결을 위한 전문적 분석/리서치 서비스 .
고객경험관리 : 고객 가치 창출을 위한 인사이트 제공 .
컨설팅 : 정성/정량적 기법을 통해 서비스 가치 극대화 .
금융시장기획 : 심층적이고 종합적인 정보수요 대응 .
마케팅 솔루션 : 제품/서비스개발/관리의 솔루션 제공 ○ 자동차 빅데이터 : 국내 최고수준의 자동차관련 토털 서비스 제공 .
차량조회서비스 : 차량번호로 차량의 토털정보를 원스톱으로 제공 .
중고차 시세 : 자동차 등록 데이터를 활용한 신뢰성 높은 시세 산정 .
신차 데이터 : 제조사별 통합된 DB형태의 차량정보서비스 제공 .
중고차 이전 데이터 : 국내 자동차 시장 분석 및 전략수립을 위한 빅데이터 분석 3) 기업의 주요 서비스 및 제품 데이터인 - 활용 사례 : 1)지**시스템(주)공급계약 체결 ·사업내용:지**시스템Dmoa서비스 업무제휴 계약 체결(‘20.10월) ·거래처명:지**시스템(주) ·성과:지**시스템(주)는 중소벤처기업부에서 지원하는 비대면 바우처 정부지원 사업공급기업으로 당사의 Dmoa서비스를사용하여회계프로그램 운영.
2)코**랩‘21년 데이터바우처 가공서비스 제공 ·사업내용:영세 화물운송사업자를 위한 금융 및 세무정보 지원서비스(‘21년) ·거래처명: (주)코**랩 ·성과:화물정보망시스템과의 연계를 통해 회원으로 가입 된 약3만5천명의 회물운송사업자를 대상으로 서비스를 제공하여 세무신고 기초자료 등 제공3)스**젯‘22년 데이터바우처 가공서비스 제공 ·사업내용:의약품 및 의료기기 유통 도소매 사업자를 위한 금융 및 세무신고 지원 서비스(‘22년) ·거래처명:스**젯 ·성과:의약품 유통ERP시스템과 연계를 통해1차로 약700사(스**젯 회원사)를 대상으로 세무신고 기초자료를 제공 하는 서비스를 제공하며,향후 타 의약품 유통ERP사와 제휴를통해 의약품 및 의료기기 유통 도소매 사업자 전체에 대해 세무신고 기초자료를 제공하는서비스를 제공하고자함
(주)웨슬리퀘스트 소개
- (주)웨슬리퀘스트은 2004-07-01에 설립되었습니다.
- 주소 : 서울 서대문구 충정로 53 (골든타워빌딩) 9층
- 주요 서비스 : 가.
가공 계획 수립●데이터 및 활용 기술 정의데이터 소스에 따른 수집대상 데이터의 속성 형태 및 구조를 파악하고 기술 요건을 정의하여 가이드라인 및 수집 계획안 제작●데이터 가공 환경 구축데이터 유형과 분석 목적을 검토하여 데이터 처리 방법론을 구성하며, 데이터의 구조와 처리 방식에 따라 데이터 가공 인프라 및 솔루션 구성 나.
가공 서비스●데이터 가공 프로세스
1) 텍스트 데이터 및 정형 데이터 수집
->
2) 텍스트 처리 및 데이터 전처리
-> 3) 데이터 랭글링
-> 4) 검수 및 검증
-> 5) 학습데이터셋 구축 순으로 데이터 가공 진행●주요 데이터 가공 업무태깅 분류 및 사전구축, 비정형/정형 데이터 변환, 분석용 데이터 제작 및 시각화, 데이터 인코딩/디코딩 작업, 데이터 융합 및 그룹 연산, 예측모델 개발 및 결화 활용 등 다양한 데이터 가공 업무 수행
1) 데이터 수집●웹/SNS 데이터 크롤링Web Crawler를 활용한 데이터 크롤링 및 웹페이지 스크래핑 모듈을 통해 특정 웹페이지를 반복적/주기적으로 데이터를 수집하여 솔루션 내 DB에 저장웹/SNS 상에서 XLS, CSV, SQL, XML, PNG(JPG) 형태 등 다양한 데이터를 추출 및 처리하는 스크래핑 봇을 통해 구조화된 형태로 저장●내외부 데이터 수집수요기업 내부 데이터의 경우, 수집 대상 데이터를 다운로드하거나 DB 복제를 통하여 수집하며,민간 및 공공 데이터의 경우,API를 활용하여 데이터를 수집 및 파싱하여 서비스 개발을 위한 통합적 데이터베이스 구축
2) 데이터 전처리
– 이상치 및 결측치에 대한 처리 기준을 정의하고 기준에 따라 데이터 전처리
– 범주형 데이터에 대하여 One
-hot 인코딩 또는 Label 인코딩 수행
– 데이터 값의 크기, 분포를 고려하여 데이터 스케일링 작업 수행
– 기존변수를 활용한 추가 파생변수 생성
– 회원정보에 대한 가명처리, 총계, 마스킹 처리 등 비식별화작업 수행3) 데이터 시각화●그래프, 차트, 분석 대시보드를 통한 시각화 처리수요기관 - 보유 솔루션 : ●빅데이터AI 솔루션자체 개발한 빅데이터 및 AI 솔루션 W
-DataAnalyzer Suite를 통해 고객사의 비즈니스 필요에 맞는 데이터를 수집, 분석, 처리, 가공하여 학습데이터를 구축구축된 학습데이터를 활용하여 문제를 해결하기 위한 인사이트 발굴을 위한 분석 알고리즘을 설계하고 시각화 서비스 제공
-솔루션 활용 주요 사례Sub
-Modules주요 기능주요 사례Data Exploration통계 분석(모든 사례에서 활용)Plotting 등 VisualizationTextAnalyzer키워드 분석(어반포레스트) 간식 개인화 추천모델 개발(낫소) 소셜 데이터 분석을 통한 마케팅 전략 수립(와신교육) 학습 및 입시상담 챗봇 시스템 구축감성 분석문서 요약CustomerAnalyzer고객군 분류(에코샌드) 고객군 분류 및 특성 분석을 통한 영업 전략 수립(크리스피) 고객 재방문 증대를 위한 마케팅 전략 수립(시대고시기획) 로그 데이터 분석을 통한 고객분석 및 CRM고객특성 분석Predictive System다중 분류 예측(서울교통공사) 지하역사 스마트 공기질 관리 예측모델 개발(근로복지공단) 산재노동자 치료기간 및 장해등급 예측(CJ올리브네트웍스) 빅데이터 플랫폼 및 센터 데이터 가공사업연속형 데이터 예측시계열 데이터 예측Recommender system콘텐츠 기반 추천(러브바드) 개인별 피부 트러블 대응 최적 제품 추천 모델 개발(고용노동부) 산재고용보험 빅데이터 기반 지능형 직업재활 코디네이터 지원 시스템 개발(크레텍) 산업공구 추천 모델 개발협업 필터링 추천연관성 분석 기반 추천●하드웨어(H/W)분석용 서버 2식분석용 GPU 서버 1분석용 GPU 서버 2CPU : Intel(R) Xeon(R) Gold 5217 CPU @ 3.00GHz x 32 coreGPU : GeForce GTX 1080 Ti(11264MiB) x 4Memory : 512GDisk : 8.0TCPU : Intel(R) Xeon(R) Gold 5215 CPU @ 2.50GHz x 40 coreG - 품질 확보 전략 : ●목적사업의 성공적인 수행을 위하여 품질보증 조직의 엄격한 관리 하에 산출물의 품질 관리●품질보증을 위한 품질관리 전략종합적인 품질보증 수행을 위해 최적화된 프로세스 적용, 대상별 품질 관리 및 산출물 검토, 체계적인 품질관리 및 전사 품질보증 활동을 실행함품질관리 전략주요 내용최적화 된 표준 프로세스 적용품질관리 프로세스 적용 및 품질 보증표준에 의한 일관성 및 효율성 확보사업착수부터 사업 종료 후 사후지원까지 일관된 품질보증체계 적용대상별 품질 중점관리와산출물 검토단계별 품질보증 활동을 통한 개발 산출물 완성도 향상품질교육 및 inspection 활동을 통한 품질보증산출물에 대한 검토 결과 보완 요구사항을 반영체계적인 품질관리 및전사 품질보증 활동공정별 검토회 및 전사 품질활동 수행으로 품질의 객관성 확보●품질관리 조직 운영품질담당 관리자(QA)는 기술지원 조직과 긴밀한 협의를 통해, 주간/월간업무 보고를 통하여 진행된 실적과 계획을 검토하고, 산출물에 대해서는 품질향상을 위해 필요한 조치를 취함각 부문별 책임자는 품질시스템 적용, 단계별 산출물 및 제출 등 품질활동을 수행하며, 발견된 부적합사항에 대해 시정 조치하고 시정조치가 완료되면 품질담당 관리자(QA)에게 시정조치 완료를 통보
- 유지보수 전략 : ●개요기술지원 및 교육계획은 공급기업인 웨슬리퀘스트가 데이터가공 서비스의 산출물로 수요기업에 제공한 AI 학습용 데이터 세트, 알고리즘 등을 사용자가 원활하게 활용할 수 있도록 지원하는 제반활동을 정의●기술지원 내용구분내용교육공급기업에 의한 전문교육분야별 요소기술 교육체계적인 교육계획 수립과 강의 및 실습을 병행교육계획서에 의거하여 교육 진행AI 기술자문사업수행 중 또는 완료 후 수행관련 기술지원 요청 시 지원AI 관련자료 및 정보 제공온라인을 통한 기술 지원무상하자보수는 유지보수 및 하자보수 계획에 의거하여 진행산출물 이전수행 시 작성된 모든 산출물을 수요기업에 인계구축 단계별 작업 지침을 매뉴얼화 하여 제공●교육 계획(안)교육 일정대상자 수장소교육명 및 내용사업 종료 2주전추후 수요기업과 협의하여 결정추후 협의AI 학습용 데이터 및 알고리즘 교육
– 학습용데이터 구성 및 개요
– 학습용데이터 활용방법
– 알고리즘 기본개념
– 알고리즘 실행방법 나.
유지보수 계획●유지보수 개요유지보수는 근본적으로 문제발생 시 신속한 복구뿐만 아니라 효과적인 예방정비를 통한 문제발생의 요소를 근원적으로 해결하는 것을 목표로 하며 기술지원을 포함주요 유지보수 대상은 사업을 통해 납품하게 되는 모든 정보자원이며 장애발생 시 신속한 복구지원, 예방정비, 기술지원, 가공 데이터에 대한 유지관리 활동을 수행한다.●유지보수 기본계획구분내용무상 유지보수 기간검수 완료 후 6개월유/무상 구분무상지원 : 기 구축된 데이터셋트 및 알고리즘의 오류 및 버그유상지원 : 신규 데이터세트 및 알고리즘의 개발유지보수 대상공급기업의 최종산출물●무상 유지보수 범위구분내용데이터세트 결함에 대한 지원구축된 데이터 세트 내 결측치, 이상치, 에러값 등 발생 시 추가적인 전처리, 가공, 태깅 등에 대해 온라인 지원/현장 지원알고리즘 오류에 대한 지원구축된 알고리즘 오류 발생 시 추가적인 알고리즘 수정에 대해 온라인 지원 또는 현장 지원기타 지원자체 후속 품질검증을 통한 수정내 - 카테고리 구분 : 전처리,품질,코딩,정보추출또는조합,태깅또는라벨링,분석
- 실적 : 구분사업명사업내용발주처사업기간1산재노동자 직업복귀 통합지원 시스템 구축근로복지공단과 외부기관 데이터 수집·정제·저장, AI 기반의 직업훈련 및 일자리 추천, 메타버스 기술을 활용 상담한국지능정보사회진흥원(고용노동부/근로복지공단)‘22년 6월~’22년 12월2부산 중소기업 빅데이터 분석 활용지원 사업부산지역 30개 중소기업의 빅데이터 분석과제 정의, 빅데이터 분석/성과창출부산정보산업진흥원‘22년 5월~’22년 12월3머신러닝에 기반한 개별 고객에 최적화된 상품 추천 서비스 개발상품 추천 서비스를 위한 학습용 데이터 세트를 구축, 고객군·제품별 상품추천 알고리즘 설계한국데이터산업진흥원 (심플리오)‘21년 6월~‘21년 11월4외국인 환자의 효율적인 의료상담 및 진료를 위한 원격진료 시스템 구축환자별 Medical Plan 추천을 위한 상담, 진료 학습용 데이터 세트 구축 및 활용지원한국데이터산업진흥원 (나누리병원)‘21년 6월~‘21년 11월5부산시 빅데이터 분석사업 용역지역 경제, 도서 문화, 시민 생활 등 분야별 빅데이터 분석을 통한 실제 추진 가능한 정책 제안 도출부산광역시‘21년 6월~‘21년 12월6빅데이터 플랫폼 및 센터 성과관리 사업16개 플랫폼 및 180개 센터 안정적인 성장을 위한 체계적/종합적 성과관리 방안 설계한국지능정보사회진흥원‘21년 6월~‘21년 12월7실내 Lidar & AR/VR AI 학습용 데이터 구축라이다 및 카메라 데이터를 수집·정제·가공하고, 보행자 검출 및 추적용 AI 모델 제공한국지능정보사회진흥원‘20년 9월~‘21년 2월8제품 및 고객 데이터를 활용한 AI 간식 추천(큐레이션) 모델 개발AI 간식 추천 모델 개발 및 고객관리시스템을 고도화하여, 고객들에게 개인화 서비스 제공정보통신산업진흥원 (어반포레스트)‘20년 9월~‘20년 12월9바디맵(Body Map) 데이터와 AI매칭 알고리즘을 활용한 맞춤형 바디케어 솔루션구축바디케어 제품 및 피부고민 온라인 데이터 수집·가공.
피부 트러블 대응 제품추천모델 구축한국데이터산 - 기업 개요 및 핵심역량 : 가.
기업 개요● 기업 개요 및 사업영역웨슬리퀘스트는‘AI·데이터 서비스 및 컨설팅 전문기업’으로AI·기계학습 모델링, 데이터 솔루션 공급 등을 제공하는데이터 분석 및AI솔루션 구축 서비스와빅데이터 및 경영분야의 컨설팅, 스포츠 마케팅 서비스를 통하여 고객사의 비즈니스 이슈 해결을 위한 컨설팅 및 솔루션 서비스 제공또한, 교육·출판·세미나를 통하여 빅데이터와 다양한 경영분야의 올바른 이해와 성공적인 확산을 위한 다양한 활동 수행●핵심 가치웨슬리퀘스트는‘탁월함과 성실함으로 고객을 섬기는, 독보적인 데이터 기반 서비스 컴퍼니가 된다(Become a unique data
-driven service company that serves the customers with excellence and sincerity)’는 비전을 가지고 E
-LIFE의 핵심가치를 바탕으로 서비스 제공●주요 연혁연도주요 연혁2004.07 웨슬리퀘스트 BSCol 한국 지사 설립, ‘Strategy Maps’ 역간2004.10한국 국가 혁신 포럼 주제 발표2004.11하버드 대학 Kaplan 교수 한국 세미나2005.01한경, 웨슬리퀘스트 ‘대한민국 BSC 대상’ 제정2008.09 Asia
-Pacific Palladium Summit 개최2008~2009 ‘Workforce Scorecard’, ’Execution Premium’ ‘TDABC: Time Driven Activity Based Costing’ 역간2015.12 Big Data 세미나 개최 ‘Big Data 추진, 이대로 좋은가’2015.12 정보화진흥원장 공로상 수상 (빅데이터 산업 활성화 기여)2016.04 Big Data 세미나 개최 ‘빅데이터를 활용한 성과창출 사례’2017.01 Big Data 세미나 개최 ‘지역경제활성화를 위한 빅데이터 활용방안’2017.12 과학기술정보통신부 장관상 수상 (빅데이터 활성화 기여)2018 서울교통공사, 근로복지공단, 한국관광공사 등 빅데이터 컨설팅 및 분석 사업2015~2022 중소기 - 활용 사례 : 가.
주요기술가공유형주요기술세부내용대표 적용사례예상수요정보추출 및 조합데이터 수집내외부에 여러 개의 테이블로 분산되어 있는 정보를 통합하고 정형화하여 원천데이터 구축 (서울교통공사) 서울교통공사의 공기질 데이터, 서울시 대기오염도, 기상청 데이터 수집대부분의 수요기업들의 데이터는 다양한 원천에 분산되어 있어 모든 데이터 가공에 필요데이터 크롤링웹 크롤링을 통하여 소셜미디어 등 웹으로부터 필요한 데이터(이미지, 텍스트 등) 를 수집(낫소) 낫소의 마케팅 전략 수립을 위해 브랜드별 검색량, 리뷰등 데이터 크롤링고객 데이터의 확보가 어려운 중소기업들의 경우, 소셜 미디어 데이터를 크릴링하여 자사 및 경쟁사 분석에 활용전처리이상치 및 결측치 처리수집한 데이터 중 누락된 값, 전체 데이터 범위에 비해 아주 작거나 큰 이상치를 찾아 기준에 따라 처리모든사례모든 데이터 분석을 위해서는 이상치 및 결측치 처리가 필수적이미지 처리이미지로 존재하는 데이터 속성 관련 정보를 OCR 기능을 이용하여 이미지내 특성 정보를 읽어 텍스트 데이터로 변환(어반포레스트) AI 간식 추천 모델 개발 및 고객관리시스템을 고도화하여, 고객들에게 개인화 서비스 제공이미지를 통하여 유사상품을 검색하거나 추천하는 유통회사의 수요 예상텍스트 처리자연어를 대상으로 형태소 분석, 키워드 분석 등을 통해 기계학습이 가능한 형태로 변환SNS 데이터, 고객관리 부서의 VOC 데이터는 대부분 텍스트로 다수의 중소기업과 고객관리 부서의 수요 예상태깅·라벨링데이터 태깅비정형데이터를 대상으로 전처리를 통해 기계학습이 가능한 원천데이터 형태로 변환하고, 분류체계 및 특성 정의에 따라 정보를 태깅(러브바드) 바디케어 제품 및 피부고민 온라인 데이터 수집·가공.
피부 트러블 대응 제품추천모델 구축비정형 데이터를 활용하여 기계학습 및 딥러닝 기반의 분석을 필요로하는 수요기업분석데이터 분석인사이트 발굴을 위한 데이터 분석 알고리즘 설계데이터 분석을 통한 인사이트 도출 및 AI 모델 개발을 위한 환경 구성(고용노동부) 산재고용보험

데이터바우처 사업관리 가공기업 정보

한국데이터산업진흥원 데이터바우처 사업을 통해 지정된 공급기업 중 데이터 가공기업 정보를 제공하고 있습니다. 본 데이터는 데이터바우처 지원사업에 참여하는 기업들의 정보를 포괄적으로 다룹니다. 특히, 수요기업이 필요로 하는 다양한 형태의 데이터 가공 서비스에 대한 정보를 제공함으로써, 데이터 활용의 범위를 넓히고, 기업의 데이터 기반 의사결정을 지원하는 역할을 합니다. 이 데이터가 보유한 컬럼은 다음과 같습니다.
기업한글명(문자형) : 해당 기업의 한글 이름
설립일자(날짜형) : 기업이 설립된 날짜
기본주소(문자형) : 기업의 본사 주소
상세주소(문자형) : 기업의 주소에 대한 추가 정보
주요서비스 상세정보(문자형) : 데이터 가공기업이 제공하는 구체적인 서비스 내용
보유솔루션(문자형) : 기업이 보유한 해결책 및 시스템에 관한 상세 정보
품질확보전략(문자형) : 데이터 품질 확보를 위한 기업의 전략
유지보수전략(문자형) : 데이터 가공 서비스 후속 지원 계획
카테고리구분(문자형) : 제공하는 데이터 가공 서비스의 카테고리 분류
등록일(날짜형) : 데이터가 등록된 날짜
실적(문자형) : 기업의 성과와 실적
기업개요 및 핵심역량(문자형) : 기업의 전반적인 설명과 주요 전문성
활용사례(문자형) : 데이터 및 서비스를 활용한 실제 사례
링크(URL) : 데이터에 대한 추가 정보 및 접근 링크
파일 다운받기
주요서비스 상세정보(요약), 보유솔루션(요약), 품질확보전략(요약), 유지보수(후속지원), 전략(요약), 실적(요약) 등의 일부 데이터 값은 데이터 미집계로 인해 공란이 있습니다.