제주특별자치도 서귀포시 데이터바우처 사업관리 가공기업
제주특별자치도 서귀포시 에는 (주)피큐레잇 외 0개의 가공기업이 있습니다.
(주)피큐레잇 소개
- (주)피큐레잇은 2019-09-03에 설립되었습니다.
- 주소 : 제주특별자치도 서귀포시 중정로 86 3층
- 주요 서비스 : 가공서비스 프로세스 및 주요 내용 수치 데이터, 이미지 데이터, 텍스트 데이터를 목적에 따라 일반 데이터 가공과 AI 학습을 위한 데이터 가공, 시각화 가능 수요 기업 요구 분석, 데이터 수집/가공, 품질점검, 검수, 사후 관리 등의 8단계 프로세스.프로세스주요 내용비고 수요기업 요구수요기업의 데이터 가공 요구 사항 정리 수요 기반 데이터 컨설팅 진행 데이터 가공업무 협약 체결 요구사항 분석 가공업무 요구사항 상세정의 및 분석 가공데이터 요건 정의 가공 서비스 상세 설계 데이터 수집* 요구사항 중 데이터 생산 필요 시, 수집 서비스 수행
– 자체 보유 중인 데이터 수집 플랫폼 (포인트몬스터)
– 크로링 엔진을 통한 웹/SNS/포털 등 외부 데이터 수집 데이터 전처리/가공 수요기업 요구에 따른 데이터 가공 공정 상세 정의.가공 서비스 종류에 따라 데이터 전처리, 데이터 품질 진단 등 요구 업무에 따른 데이터 가공 수행.일반 가공데이터 전처리수요기업 요구에 따른 전처리불용어 처리, Null 값 제거 데이터 시각화각종 데이터 속성 시각화(통계분석 / 시계열 분석 등) 기타 데이터 처리기타 데이터 처리 요구 반영 AI 가공 이미지 처리바운드리 박스, 태깅 & 레이블링 등 자연어 처리불용어 처리, 형태소 분석, 워드 임베딩, 단어사전 구축, 데이터 변환 등 데이터 품질점검품질점검 프로세스에 따른 품질 검사 수행 데이터 검수가공데이터 최종 검수 데이터 제공검수 완료된 데이터 수요 기업에 공급 데이터 사후 관리데이터 품질 및 수정 요구사항 발생 시, 하자/보수 등으로 대응.수요 기업의 서비스 개발에 대한 기술 지원 및 컨설팅 (*별도 협의) 데이터 가공, 분석, AI 모델링 등 가공서비스 상세 내용
1) 데이터 수집자체 플랫폼 [피큐레잇] 를 통한 데이터 수집 가.
서비스 개요 자체 보유/운영 중인 ‘커뮤니티 기반 지식 큐레이션 플랫폼 피큐레잇’를 통해 회원 대상 미션을 진행하여, 다양 - 보유 솔루션 : 데이터 저장, 가공, 분석, 시각화, 모델링 등 최적의 데이터 서비스 제공을 위한 워크스테이션, 서버, 클라우드, SW 등 물적 자원 보유.
구분 내용수량 용도비고 H/W분석용 고성능 랩탑3ML, DL 모델 개발 및 테스트 일반 업무용 노트북(i7이상)12일반 업무 및 SW 개발용 AWS EC2 서버1실물 서버가 아닌 가상환경 사용 S/WAWS1데이터 저장, AI 모델링, AI 학습 Visual Studio Code1통합 개발툴 Airflow1데이터 엔지니어링 Postman1개발 테스트툴 Confluence1문서화 도구 Jira1협업 관리툴 Data Grip1데이터베이스 GUI 툴 Docker Desktop1개발환경 구동툴 Figma1디자인 협업툴 Anaconda1파이썬, R 개발툴 Cuda1GPU 개발툴 Google Analytics1웹 데이터 분석 Matomo1웹 데이터 분석 - 품질 확보 전략 : 1.
품질 확보 전략 품질 확보를 위한 품질 검사 전담 조직 구축 및 전담 인력 추가 채용을 통한 조직 강화하고 품질책임자를 임원급으로 지정 (
1) 품질 총괄 관리자
– 품질 목표 및 추진 방향 설정
– 품질기준 및 품질 지수 관리
– 품질측정 프로세스 구축 및 항목 관리 (
2) 실무 책임자
– 데이터 분석가, 개발자와 함께 산출물 품질 검수
– 사후 관리(유지 보수 등) 및 고객사 품질 만족도 조사
– 요구, 불만 사항 등을 파악하여 개선대책과 문제점, 해결방안 모색 (3) 정보 보안/시스템 관리자
– 시스템, 개인정보 등 데이터 보안 관리 (4) 품질관리 지원 조직 구축
– 외부 전문가 집단의 자문조직 구축하여 기술 및 데이터 품질 관리 2.
품질 확보 프로세스 및 가이드라인 구축 정부 기관의 공공데이터 품질관리 6단계 절차를 준용한 품질 진단 실시 고객의 요구 데이터 형태에 따른 가공 계획 수립 데이터 가공에 따른 품질 검사 및 데이터 검수 후 정제 데이터 전달 구분내용 데이터 품질 진단 계획 수립
– 데이터 품질 진단 프로젝트 정의
– 수행 조직 정의
– 품질 진단 프로세스 정의
– 세부 시행 계획 확정 데이터 품질 기준 및진단 대상 정의 데이터 품질 기준 선정 품질 이슈 조사 데이터관리 문서 수집
– 진단 대상 중요도 평가
– 품질 진단 대상 선정
– 핵심 품질 항목 선정
– 데이터 프로파일링
– 업무 규칙 도출 데이터 품질 측정품질측정 계획 수림 품질측정 체크리스트 준비 데이터 품질측정 수행 데이터 품질측정 결과 보고 데이터 품질 종합보고서 작성 데이터 품질측정 결과 분석품질 오류 원인 분석 품질 개선 방안 도출 데이터 품질 개선품질 개선 계획 수립 개선 활동 수행 개선 결과 보고 3.
외부 자문조직을 구성하여 기술 및 데이터 품질 향상 도모 당사 공동창업자인 KAIST 교수를 통해 빅데이터 분석 및 AI 모델링 협업 진 - 유지보수 전략 : 1.
유지보수 지원 전략 데이터 및 데이터 구조를 일관성 있게 관리하고 업무 생산성을 높일 수 있도록 프로세스 구축정보 요구사항의 추적관리를 위해 요구사항 발생부터 데이터베이스 반영 및 데이터 검증 프로세스까지 고려하여 설계안정적인 운영을 위하여 데이터 및 데이터 구조 변경에 따른 영향도 분석을 수행 2.
유지보수 제공 계획
1) 제공 대상 : 수요 기업에 납품한 결과 데이터 전량
2) 범위 : 사업수행계획서 및 사전 협의서에 명시된 요구사항과 부합하지 않는 데이터에 대하여 계약 종료 이후 하자보수 및 품질 개선 3) 기간 : 무상 하자보수 (사업 종료일로부터 6개월)/유상 하자보수 비용 및 기간은 별도 협의4) 세부 내용 구분내용 유지보수 대상
– 공급한 데이터의 모든 구성 요소를 대상으로 지원
– 재가공이 필요한 공급 데이터에 대해 하자보수(재가공)을 지원 무상유지보수대상사업 종료 후 6개월 이내에 공급기업이 수요 기업에 제출한 데이터의 수량과 품질에 하자가 있는 경우 재작업 진행내용공급 데이터의 수량과 품질에 대한 오류 발생 시, 데이터의 재생산이 필요한 경우, 수요 기업과 협의한 범위 내 데이터 재생산결과 데이터 최적화 지원 유상 유지보수대상무상제공 범위를 벗어나는 데이터 추가 제공 등에 대한 사항 내용무상 유지보수 기간 중 신규데이터를 추가하거나 데이터의 구성 변경 등을 실시할 경우, 상호 협의 후 실비 제공을 원칙으로 함수요 기업의 실수 또는 천재지변에 의한 장애에 대해서는 책임 지지 아니함비용유지보수 내용에 따라 산정하며, 상세 비용은 수요/공급 기업 간 협의.2.
유지보수 관리 계획 사업 완료 후 해당 사업의 환경적, 기술적 특성을 이해하는 유지보수 책임자를 지정하여, 하자보수 및 장애 발생에 대하여 신속하게 대응하기 위해 아래 지원 체계를 구축
1) 유지보수 책임자 : 수요 기업과 데이터에 대한 수량, 오류 확인 및 유지보수에 대한 업무 총괄
2) 유지보수 담당자 : 유지보수 책임자로부터 전달받은 내용을 기반으로 작업 지 - 카테고리 구분 : 전처리,정보추출또는조합,태깅또는라벨링
- 실적 : 당사는 지난 2년간 데이터바우처 수요기업으로 참여하며, 사업에 대한 전반적 이해, 및 수요기업의 니즈에 대해서 파악하였음또한 창업성장기술개발(디딤돌)을 통해 데이터 구축 기반 및 데이터를 활용한 모델 개발을 수행했으며, 이러한 성과는 TIPS로 연결되어 지속적인 기술적역량을 강화하고 있음사업명 2021~2022년 데이터바우처 AI가공 사업(수요기업) 완료(연속지원)사업내용국내(202
1), 해외(202
2) 주제별 웹 스크랩핑 데이터 구축주관기관과학기술정보통신부 / 데이터산업진흥원계약기간2021년 6월 1일 ~ 2021년 10월 31일 (총 사업비 0.7억원) 2022년 6월 1일 ~ 2022년 10월 31일 (총 사업비 0.7억원) 주요성과언어별 ML/DL 기반 데이터 확보/모델 개발 사업명 국가연구개발사업 디딤돌 프로그램 완료 사업내용AI기반의 북마크 정보분석을 통한 지식정보 큐레이션 시스템 구축주관기관중소벤처기업부 / (사)한국엔젤투자협회계약기간2021년 11월 01일 ~ 2022년 10월 31일 (총 사업비 1.8억원) 주요성과데이터 수집/분류/추천을 위한 ML/DL 기반 기술개발(완료) 사업명 국가연구개발사업 TIPS 프로그램 진행 中 사업내용지식의 탐색 및 확장 경험을 제공하는 큐레이션 플랫폼 구현을 위한 머신러닝 기반의 지식 분류, 추천, 검색 알고리즘 개발주관기관중소벤처기업부 / (사)한국엔젤투자협회계약기간2022년 8월 01일 ~ 2024년 07월 31일 (총 사업비 5억원) 주요성과데이터 수집/분류/추천/검색/관리를 위한 ML/DL 기반 기술 고도화 - 기업 개요 및 핵심역량 : 기업개요피큐레잇은 유저가 북마크를 통해 주제별 수집한 정보의 집합을 다른 유저에게 노출시켜 지식을 공유하는 플랫폼을 운영함피큐레잇에서 온라인 콘텐츠를 수집하면 플랫폼 상의 페이지에서 분류되고 바로 접속한 형태로 구축됨과 동시에 온라인 콘텐츠가 보유한 더 많은 메타데이터가 데이터 서버에 축적되고 이것이 방대한 지식체계를 형성함피큐레잇은 개인의 리서치 과정을 효과적으로 개선하기 위해 원클릭 수집 등의 도구를 마련하였고, 이러한 도구를 활용하여 전문적인 데이터 수집에서 방대한 속성 정보를 담은 데이터 셋과 주제별 분류되고 즉시 탐색과 이용이 가능한 서비스 화면을 제공함PC웹, 앱 등의 프로덕트 라인업을 가지고 있으며, 한국어와 영어를 지원하여, 영문 콘텐츠 및 외국인 작업자도 사용할 수 있음핵심역량데이터와 콘텐츠 수집에 동시에 진행되는 플랫폼 보유국내외 키워드 추출, 분류, 추천 관련 특허 다수 보유대량 링크 자동수집 및 분류 가능한 AI 모델 보유
- 활용 사례 : 1)데이터 수집다.응용 사례(활용 분야)
– 2022년 글로벌100대 트렌드에 대한50명이상의 작업자가 검색/수집/분류
-연령별,직업별 교육 콘텐츠(웹문서,서적,유튜브 등)에 대한 검색/수집/분류
-전문가SNS(링크드인 등)의 특정 직무,특정 기업,특정 연차별 프로필 링크 수집
-지정 키워드에 대한SNS게시물 메타데이터 수집 및 태깅
-구글 학술정보 기반 특정 연구주제에 대한 연구 히스토리 데이터 수집
-전국 지역별 맛집 리뷰 블로그 링크 수집
-특정제품에 대한 국내외 커뮤니티 리뷰 게시물 크롤링
-구글 학술정보 내 특정 주제에 대한 논문 메타데이터 크롤링
-수천 개 스타트업에 대상 일자별 보도자료 수집 및 분류
2)데이터 가공가.서비스 개요
-통계적 분석과 인공지능 분석 모델의 정확도 향상을 위한 이상치 검출,제거
-불균형 분포를 가진 데이터 셋을 최적의 입력 데이터로 변환나.응용 사례(활용 분야)
-통계적 분석을 위한 결측치 보완(null값 처리) /크론바흐알파계수/상관분석
– L1 Lasso, L2 Ridge를 활용한 데이터 정규화 및 표준화,데이터 리스케일링
-데이터 샘플링(under sampling, over sampling)
-데이터 클러스터링 5)데이터 분석 서비스다.응용 사례(활용 분야)
-상품,서비스,소셜 등의 리뷰 데이터 분석을 통한 제품의 긍/부정 감성 분석
-챗봇 자동 질의/응답 데이터 기반의 소비자 감성 분석
-얼굴 영상,사진을 통한 고객의 현재 감정 상태 파악
-개인정보 비식별화가 필요한 데이터 또는 서비스

데이터바우처 사업관리 가공기업 정보

한국데이터산업진흥원 데이터바우처 사업을 통해 지정된 공급기업 중 데이터 가공기업 정보를 제공하고 있습니다. 본 데이터는 데이터바우처 지원사업에 참여하는 기업들의 정보를 포괄적으로 다룹니다. 특히, 수요기업이 필요로 하는 다양한 형태의 데이터 가공 서비스에 대한 정보를 제공함으로써, 데이터 활용의 범위를 넓히고, 기업의 데이터 기반 의사결정을 지원하는 역할을 합니다. 이 데이터가 보유한 컬럼은 다음과 같습니다.
기업한글명(문자형) : 해당 기업의 한글 이름
설립일자(날짜형) : 기업이 설립된 날짜
기본주소(문자형) : 기업의 본사 주소
상세주소(문자형) : 기업의 주소에 대한 추가 정보
주요서비스 상세정보(문자형) : 데이터 가공기업이 제공하는 구체적인 서비스 내용
보유솔루션(문자형) : 기업이 보유한 해결책 및 시스템에 관한 상세 정보
품질확보전략(문자형) : 데이터 품질 확보를 위한 기업의 전략
유지보수전략(문자형) : 데이터 가공 서비스 후속 지원 계획
카테고리구분(문자형) : 제공하는 데이터 가공 서비스의 카테고리 분류
등록일(날짜형) : 데이터가 등록된 날짜
실적(문자형) : 기업의 성과와 실적
기업개요 및 핵심역량(문자형) : 기업의 전반적인 설명과 주요 전문성
활용사례(문자형) : 데이터 및 서비스를 활용한 실제 사례
링크(URL) : 데이터에 대한 추가 정보 및 접근 링크
파일 다운받기
주요서비스 상세정보(요약), 보유솔루션(요약), 품질확보전략(요약), 유지보수(후속지원), 전략(요약), 실적(요약) 등의 일부 데이터 값은 데이터 미집계로 인해 공란이 있습니다.