서울 강서구 데이터바우처 사업관리 가공기업
서울 강서구 에는 라크(주), 주식회사 테크스페이스, 주식회사 닥터송 외 18개의 가공기업이 있습니다.
라크(주) 소개
- 라크(주)은 2019-11-05에 설립되었습니다.
- 주소 : 서울 강서구 공항대로 168 1208호 (마곡동, 747타워)
- 주요 서비스 : 의료 영상 데이터 인공지능 학습 지원
– 데이터 라벨링 및 검증
– 데이터 품질 교정 및 규칙 컨설팅
– BIG data에서 이미지 추출 방법 제시
– 데이터 제작 및 추출 정보 시각화 작업
– 최종 결과 분석 및 결과 보고서 제시
– 학습 데이터에 맞는 알고리즘 제시 이미지 분석 품질 지원
– 실시간 판독 프로그램 오차율 최소화 지원
– 이미지 분석품질 결과와 병리전문가의 편차 분석
– 학술데이터 통계 추출 및 분석이미지 보고서 생성
– 기관의 품질관리 기준 컨설팅 및 제작 방법 제시
– 기관 분석 서버 구축 지원 및 컨설팅 병리조직 스캔서비스
– 병리조직 스캔서비스 (슬라이드 전용 스캐너 지원)
– 검출이미지 디지털화 작업 지원
– 빅데이터 스캔이미지 분리 작업 지원
– 라벨링 작업화 지원 자업
– 빅데이터 저장 백업 방법 컨설팅 - 보유 솔루션 : 기술
– 의료 이미지 제작 및 데이터 분리 추출 기술
– 빅데이터(60,000*40,000pixel, 장당 평균)의 데이터 구축기술
– 병리조직 다기관 다소견 데이터셋 구축 기술
– 빅데이터 이미지 가시화 프로그램 기술
– 핸드폰 실시간 조직세포 AI검출 프로그램 인적
– 20년차 프로페셔널 엔지니어 3명 (영상처리, 빅데이터, 핸드폰 등의 대기업 및 글로벌기업 경력)
– 15년차 품질지원 2명 (다국적 기업 지원, 품질 지원, 유지보수)
– 데이터 시각화 엔진니어 (프로그램 개발팀 : 2개팀 2명)
– 데이터 라벨링
– 라벨링 지원 업체 : 2업체 (규모 12명)
– 외부 : 병리전문가 자문단 6명
– 하드웨어 지원팀 : 1개팀 1명 장비(AI 개발관련) 분류사양수량비교서버제온2개, 수냉식 3090 4개 2대학습용서버I9, 3090 2개1대학습용서버HP 제온, 2080ti 2개2대학습용서버dell 제온 40core1대서비스서버HP 제온 40core1대서비스워크스테이션HP I9, 3090 1개4대개발용워크스테이션DELL 제온, 2080 2개3대개발용PCi7, i53대개발용NAS56TB, synology1대개발,백업NAS12TB synology1대개발,백업 - 품질 확보 전략 : 초기 데이터 정의
– 병리 조직 이미지 학습 정의
– 추출 방법과 분석 방법 사전 정의
– 데이터의 분별이 매우 어려워 사전 정의 후 파일럿 구축 후 수정
– 라벨러 규칙 정의가공 데이터 추출
– 라벨러 규칙에 의해 추출
– 이미지 컨트롤에 대한 옵션 정의서와 절차서 제작라벨링 검증
– 라벨링 작업자와 검증자 구분
– 검증자는 병리 전문가 또는 수요기업 담당자에 재차 검수
– 라벨링 데이터의 일차 데이터 오류 검증
– 이미지 라벨링 규칙에 어긋난 내용 확인
– 교차 검증 라벨러간 검출 프로그램 간 비교사용자 검증
– 검출된 이미지를 보고서 형태로 제시
– 알고리즘별 검출 보고서로 비교 검토
– 빅데이터로 분석 검증프로그램 검증
– 프로그램을 이용하여 다수의 데이터를 검출 비고
– 프로그램의 실기간 또는 알고리즘 학습 방법 간 비교 검토
– 출력 성능 비교, 추후 검출 비교유지보수
– 검출 결과 지속적으로 업그레이드 방법 컨설팅 - 유지보수 전략 : 프로젝트 관리
– 프로그램 및 데이터 지속 사용 관리
– 데이터학습 업그레이드 방안 컨설팅투입인력관리
– 지속적 투입인력 재사용 가능성 교육
– 학습 데이터를 증가 방안 교육통합관리
– 데이터 통합하여 프로그램 업그레이드시 관리지원
– 데이터 백업 정책 관리
– AI 프로그램 변경 지원 - 카테고리 구분 : 전처리,품질,코딩,시각화,정보추출또는조합,태깅또는라벨링,분석
- 실적 : 국가과제
– 독성조직 진단 맞춤형 데이터 구축 플랫폼 개발 : 2022~2024 : 2.8억 (중소벤처기업부)
– AI 실시간 조직 판독 시스템 개발 : 2021~2022 : 1.2억 (중소벤처기업부)
– 차세대 독성병리 진단 기반 구축 개발 : 2020~2023 : 12억 (식품의약품안전처) 용역과제
– 병리조직 판독 시스템 류 3건 : 2020~2022년 (안전성평가연구소) 인공지능기술
– 딥러닝 특허 출원 3건 등록 2건, 영상처리 프로그램 등록 2건 - 기업 개요 및 핵심역량 : 국내외 CRO 기관의 병리 전문가가 사용하는 조직병리 이미지(디지털 슬라이드 이미지)의 정량화 인공지능 분석 소프트웨어를 사용하여, 일관되고 정확한데이터를 제공합니다.Labeling(Annotation), Viewer등의 프로그램이 개발, 완료되어 고객에 제공 가능하며, 필요시고객에 맞는 프로그램도 개발 가능 합니다.
- 활용 사례 : 의료 영상 분석 대행
– 이미지 데이터 품질 관리 및 AI 학습 대행
– 알고리즘별 비교 분석 데이터 제공
– 빅데이터 분석, 학술연구 지원, 통계데이터 제공
– 데이터베이스 형태의 결과로 제시 타 프로그램과 연동형태 제공 비임상, 임상, CRO, 의료기관에 맞춤형 보고서
– 기관별 맞춤형 보고서 제시
– 분석한 결과의 DATABASE화 작업
– 기관별 연결 코드 연동 서비스 제작
– 여러 소견 검출 비교 서비스 실시간 분석 서비스
– 분석할 병리조직을 실시간 분석할 수 있는 시스템 개발
– 차별화 된 보고서 제작
– 분석 결과 실시간 결과 검토 및 비교 보고서 생성
주식회사 테크스페이스 소개
- 주식회사 테크스페이스은 2018-01-03에 설립되었습니다.
- 주소 : 서울 강서구 공항대로 222 (발산W타워) 1015~1016호
- 주요 서비스 : ?
- 보유 솔루션 : 데이터 가공 추진 방안
– 수요 기업 원천 데이터를 수집하여, 이를 수요 기업 진출 희망 분야의 기반 환경과 접목(수요조사 및 맞춤 데이터 필드 설계)하여 신뢰와 활용성을 동시에 갖춘 빅데이터를 제공함으로서, 수요기업이 목표하는 플랫폼별 호환성 높은 연동 데이터 제공을 구현하겠습니다.
수요 기업과 수요자를 고려한 데이터 가공 계획 프로세스 수립수요 기업 데이터 서버 수집 정보 수요조사 데이터마켓수집용 raw 데이터 실시간 데이터 적재 수요조사 기반 맞춤 데이터 요청 데이터 분류 및 표준화 데이터 시각화 데이터 2차 가공데이터 종별 최적화 · 품질 강화 빅데이터플랫폼 수요자 통계 / 시각화 맞춤 데이터 설계 플랫폼 마켓 마켓 형성 수요 기업의 비즈니스 가치 구현을 염두한 가공 고도화 프로세스 수립융합/복합DB보강 분석 System 비즈니스 가치구현상호 DB 패턴분석 수요 기업 요구기반 데이터가공공공 DB 수요분석 활용 매뉴얼(가이드)민간 개방 DB 통계분석 활용 예시시각화 인프라 구축·운영 방안수요 기업이용자⇔IPSFirWall⇔클라우드분류 저장소⇔서버접근제어DB접근제어관리자Web FirewallWeb ServerWAS Server레거시형태저장웹방 - 품질 확보 전략 :
- 유지보수 전략 :
- 카테고리 구분 : 전처리,코딩,시각화,태깅또는라벨링,분석
- 실적 : 유통채널명진출시기판매 아이템판매금액헤럴드2020.07.~납품형 ‘BaaSClopi’20백만원스튜디오엑스코2020.10 ~ BaaSClopi 크레딧37백만원엠프티코퍼레이션2020.08.
~ 2020.10.납품형 ‘BaaSClopi’17백만원크레딧 결재형2020.09.
~크레딧 차감형32백만원실적 품목명(실적 기준 연도)품목용도품질 및 가격경쟁력판매액판매채널· 서비스 화면예시구축형 ‘BaaSClopi’ (‘20.7~)온프레미스 기반백엔드 데이터 자동 전처리 플랫폼BI툴,OLAP제품을 이용하여 개발시 1억원대 예산이 소요되는 대쉬보드 서비스를 약 2천만원대 비용으로 개발하여 납품 20백만원㈜ 헤럴드타임스(오프라인) 경쟁사 제품대비 75% 가격으로 동일품질의 서비스 구현 가능크레딧 차감형‘BaaSClopi’ (‘20.10~)클라우드 기반백엔드 데이터 자동 전처리 플랫폼데이터 포털, 데이터 클라우드 환경 구성용으로 최적화된 사용량 과금형 버전37백만원㈜ 스튜디오엑스코(온라인)경쟁사 대비 평균 90% 저렴한 가격으로 운영 가능 구축형 ‘BaaSClopi’ (‘20.8 ~ 10)온프레미스 기반백엔드 데이터 자동 전처리 플랫폼BI툴,OLAP제품을 이용하여 개발시 1억원대 예산이 소요되는 대쉬보드 서비스를 약 2천만원대 비용으로 개발하여 납품17백만원㈜ 엠프티코포레이션(오프라인)경쟁사 제품대비 75% 가격으로 동일품질의 서비스 구현 가능 크레딧 차감형‘BaaSClopi’ (‘20.10~)클라우드 기반백엔드 데이터 자동 전처리플랫폼데이터 포털, 데이터 클라우드 환경 구성용으로 최적화된 사용량 과금형 버전32백만원크레딧 결제형(온라인) 경쟁사 대비 평균 90% 저렴한 가격으로 운영 가능 - 기업 개요 및 핵심역량 : – 공급기관 주식회사 테크스페이스는 데이터 마켓을 통해 수요기업이 데이터 상품을 거래/유통하며 플랫폼에서 직접 데이터를 분석할 수 있도록 백엔드 인프라 기반의 가공 및 분석 도구와 시각화 분석 프로세스 기능을 제공하는 데이터 플랫폼 솔루션 기업입니다.
– 2020년 플랫폼 기반 서비스 BaaSClopi를 신규 런칭하여 자동완성형 서비스와 분석 리포트 서비스를 구축하였으며, 2021년 시각화 기반 백엔드 인프라 빅데이터 플랫폼의 마켓 플레이스 고도화 계획을 통해 데이터 개방 및 유통 활성화 기반을 확장할 예정입니다.
– 데이터 분석은 물론 전처리 프로세스 기능으로 백엔드 분야 개발자는 물론 일반 사용자도 손쉽게 수요기업의 데이터를 전처리할 수 있는 기반을 갖추었으며, 금년을 계기로 시각화 기반 의 차별화된 전처리 기능은 물론 의사 결정 제공 기능을 제공하여 4차 산업혁명에 걸맞은 혁 신서비스 창출 활성화에 기여하도록 최선을 다하겠습니다. - 활용 사례 : 기능서비스 실행 화면 예시설명데이터 테이블 자동 생성 신속한 의사 결정이 필요한 스타트업 개발자는 물론 비숙련 개발자들을 위해
1) 총 4단계의 간결한 입력 단계 기능 지원 및
2) 각 입력단계 전환시 이전 단계 입력 일치 여부 확인 등으로 오류 입력 기회 제거 등으로 정확하고 신속한 프로토타입 생산 가능.
API 자동 생성
주식회사 닥터송 소개
- 주식회사 닥터송은 2016-01-07에 설립되었습니다.
- 주소 : 서울 강서구 공항대로 227 마곡센트럴타워1 504호
- 주요 서비스 : 1.
업무 협의 및 데이터 설계l 수요기업의 가공 데이터 요구사항 정의 및 분석l 필요한 데이터 종류 및 품질과 수집,가공방식 협의l 데이터 가공정제 및 융합을 위한 용어,형식,유형 등 기준 확인l 가이드라인의 모호성을 최소화하고,고객사에납품할 품질 기준을 합의하고 파일럿 프로젝트를 진행l AI학습용 데이터 설계과정은ETL(ExtractionTransformation
– Loading)과정에 따름2.
데이터 수집(Crawling)l 정형/비정형 데이터 수집l 인공지능 학습을 위한 텍스트,이미지,영상 데이터 수집l 공공 데이터,오픈 데이터,보유 데이터,상업용 데이터,데이터 구매,직접 수집 등l SNS(소셜네트워크), Portal Site의 구조적,비구조적외부 오픈 데이터l 각종 로그데이터,트랜잭션 처리로그,웹 로그 등 기업 내부의 비구조적 데이터3.
데이터 전처리(Preprocessing)l 데이터 종류 및 특성,품질에맞춰 공학적인 전처리 진행l 데이터 정제(cleaning),데이터통합(integration),데이터 축소(reduction),데이터변환(transformation)l 당사 내부 구성원들은 의료기관(병원)임상 경험과IT지식이 풍부하며 전문성높은 전처리 수준을 보유하고 있음,전문 의학 지식을 갖추어 의료 및 헬스케어 데이터 정제시 데이터 유실을 줄이고 품질을높이고 있음4.
데이터 가공(Annotation)l 텍스트 데이터 가공(Text dataAnnotation)l 자사 데이터 가공 솔루션SDA(쓰다)를 활용하여 인공지능 학습데이터 구축l 이미지 데이터 가공(Image dataAnnotation)l 자사 데이터 가공 솔루션GDA(긋다)를 활용하여 인공지능 학습데이터 구축l 의료 및 헬스케어 데이터 가공은 개인정보법에 의거 의료기관의 의료데이터(텍스트,이미지,영상)에 직접적인 접근이 불가능할 경우IRB(InstitutionalRev - 보유 솔루션 : 1.
데이터 수집 솔루션 ‘MDA(모다)’l 병렬 고속 스크래핑 엔진 : 타겟 자료수집시 병렬로 이미지를 제거하고 고속 파서를 사용하여 빠르게 데이터를 수집합니다.l 포털의 단순 뉴스, 웹페이지 외 다양한채널 지원 : 블로그, 카페, 트위터, 페이스북 등 다양한 채널에 대한 스크래핑이 가능합니다.l 다양한 형식 지원 : txt, csv, html,json 등 다양한 형식의 출력을 지원합니다.l 스크래핑 차단 방지기능 : 스크래핑 차단에대응하기 위해 딜레이, IP 우회 등 방지기능을 갖추고 있습니다.l 시각화 자료 제공 : 타겟 url 및 스크래핑 상황과 결과를 안내하는 시각화 자료를 제공합니다.2.
데이터 정제 및 분석 솔루션 ‘닥터NLP’l 자연어 데이터 분석을 위한 다양한 분석 기능 : 형태소 분류, 단어사전 구축 등l 다양한 모델링 지원 : 토픽 모델링을 위한 LDA, BERT, LDA
-BERT, TF
-IDF 등 다양한 모델링 알고리즘 선택 기능l csv 파일 지원을 통한 편리한 분석 : csv 파일 업로드를 지원함으로써 빠르고 편리한 분석이 가능l 텍스트 전처리 기능 : Normalization, stemming,stop words 설정 등 텍스트 전처리 기능l 데이터 분석을 위한 시각화 기능 : UMAP, wordcloud,graph 등 데이터 분석을 위한 다양한 시각화 툴 지원3.
텍스트 데이터 가공 솔루션 ‘SDA(쓰다)’l 편리한 문서 불러오기 기능 : word, text 파일을 읽어 Input 데이터로 로드하여 사용할 수 있습니다.l (특허) 문장/문단자동 구분 기능 : 로드한 문서의 문장과 문단을 자동으로 분류하여 구분 처리합니다.l 문장/문단 이동 편집 기능 :문장/문단의 이동과 삽입, 삭제 기능을 편리한인터페이스로 제공합니다.l 맞춤법, 띄어쓰기 체크 기능: 원본 문서의 맞춤법과 띄어쓰기를 버튼 한번 클릭으로 자동 검사합니다. - 품질 확보 전략 : 1.
데이터 품질 확보 및 관리 전략l 체계적인 데이터 품질 관리를 위해 품질 전담 담당자를 지정하고 지속적으로 유지 관리하고있으며,자체적으로 데이터 품질 확보 및 관리를 위해 시스템을 구축하는 등의 노력을 기울이고있음l 마스터 데이터 품질관리 프레임워크(Masterdata
– Quality management framework)는 기본 원칙을 규정하고 프레임워크 구현과 데이터의 교환,출처의 요구사항을 규정l 마스터 데이터의 품질을 관리하기 위한 절차 및 역할을 정의한 국제 표준으로 지정된ISO 8000
-150을 기반으로 품질 인증 - 유지보수 전략 : 1.
유지보수 제공 및 관리 계획l 사업 완료 후 데이터 가공 프로세스와DB관리의환경적,기술적 특성을 충분히 이해하는 하자보수 책임자를 지정함l 항시 백업되도록 연락 가능한 담당자를2명이상으로 지정하고,담당자 변경 시 즉시 수요기업의 담당자에게 통지함l 하자보수 발생에 대한 신속한 대응과 문제 해결을 위한 비상 연락망을 구축함l 당사 고객센터(유선02
-886
-7000및 카카오계정@(주)닥터송)를 통해 접수 후 전담 인원에게 이관함으로써 일관성이 있는지원체계를 유지하고 있음 역할 담당자 및 업무분장 유지보수 책임자 연구소장 가공 데이터의 하자보수 사항 파악 및 유지보수 총괄 유지보수 담당자 수석 연구원 보수 방법과 결정에 따른 실무 수행, 유비보수 운영 관리 구분 내용 유지보수 대상 공급한 데이터를 대상으로 지원한다 재가공이 필요한 공급 데이터에 대한 재가공 등의 하자보수를 지원한다 무상유지보수 대상 사업 완료 후 6개월 이내에 발생하는 데이터 결함에 대한 유지보수 가공 가이드라인에 맞지 않게 가공되어 재가공이 필요한 데이터 내용 무상 유지보수 기간에 일어나는 유지보수 활동 데이터 변동 시 현행화 데이터 n회에 한하여 제공 가공 가이드라인에 맞지 않게 가공된 공급 데이터 재가공 유상유지보수 대상 무상제공 범위를 벗어나는 데이터 추가 제공 및 가공 등에 대한 활동 수요기업의 실수 또는 천재지변에 의한 장애 무상유지보수 기간 경과 후 발견한 하자 - 카테고리 구분 : 전처리,품질,코딩,시각화,정보추출또는조합,태깅또는라벨링,분석,기타
- 실적 : 용역명 용역기간 주무부처(전담기관) 참여형태 인공지능 자연어처리를 이용한 지능형 의료콘텐츠 관리시스템 2020.05.22~2021.03.21 중소벤처기업부 (창업지흥원) 주관기관 인공지능 헬스케어 생성 시스템 2020.06.30~2020.12.31 과학기술정보통신부 (정보통신산업진흥원) 주관기관 의학정보와 의료기사 빅데이터 수집 및 가공 2020.05~2020.10
–
– 의료기관 콘텐츠 가공 및 학습데이터 구축 2020.11~2021.01
–
– 감염 환자 격리 이송을 위한 사람 추종형 반자율 침상 로봇 개발 2021.04.01~2023.12.31 산업통상자원부 (한국산업기술평가관리원) 참여기관 데이터바우처 AI 공급기업 선정 (3년 연속) 2021.03~2024.02 과학기술정보통신부 (한국데이터산업진흥원) 공급기업 부끄러운 피임약 상담, 망설이지 말고 AI 약사에게 2021.06~2021.11 과학기술정보통신부 (한국데이터산업진흥원) 공급기업 AI바우처 공급기업 선정 ( 2년 연속) 2021.12~ 과학기술정보통신부 (정보통신산업진흥원) - 기업 개요 및 핵심역량 : 1.
주식회사 닥터송 소개 및 철학l 닥터송은2006년 병.의원MSO및 컨설팅,마케팅 회사로 출발하여2016년1월7일 법인으로 전환하며 헬스케어 데이터를가공하고AI솔루션을 개발하는 인공지능전문회사로 사업 분야를 확장함l 헬스케어 빅데이터 인공지능 전문기업’닥터송’은 자사 통합 플랫폼을 바탕(제품명:모다,쓰다,긋다)으로바탕으로 최상으로 헬스케어 데이터 분석과 기업별 맞춤형 솔루션을 공급하고 있음l 국내100여 곳 이상의 의료기관(병원)및 헬스케어 기업 거래처를 보유하며,의료기관을 포함한 헬스케어 분야에 전략,기획,기술,실행 등 다년간의 노하우를 보유하고 있음l “창의력과 경험,기술이 바꾸는 세상,바로전문가들이 꿈꾸는 세상입니다”라는 철학을 바탕으로 의료전문가,빅데이터분석가,개발자,UI/UX디자이너,마케터들이 힘을 합쳐 지금까지 없었던 차별화된 경쟁력을 만들어내고 있음2.
닥터송 핵심역량l 연구개발을 위해 기업부설연구소를 설립하고,벤처기업인증,이노비즈 인증,강소기업 선정 등을통해 경영력과 기술력을 인정받음l 자연어처리및 인공지능 기반 저작 관련 특허 해외 출원1건,국내3건등록,국내 출원2건l AI의료 챗봇 관련APBP SSCI급 논문, NLP(자연어처리)관련 논문 발표l 키워드·문장·문단별 분류 및 분석 핵심 알고리즘 개발,데이터 분석 관련 소프트웨어 저작권 등4건을보유하고 인공지능 소프트웨어 개발 및 빅데이터 분석 알고리즘 연구하고 있음3.
닥터송 인적역량l 인공지능과 빅데이터 관련 핵심 알고리즘을 개발하기 위한 전문개발인력과 의료·헬스케어데이터를 가공 및 검수할 수 있는 보건의료인력,데이터 분석을 위한 연구원,데이터 시각화를 위한 전문디자이너,사업화 과정과기획 및 홍보에 시너지를 낼 수 있는 헬스케어 전문마케터가 내부에 상주하고 있음l 헬스케어 데이터 가공업무를 전문으로 하는 기업으로써 경쟁력을 높이기 위해 의료기관근무경력의 보건의료인(간호사,의료기사 - 활용 사례 : 1.
텍스트 데이터 가공 솔루션 ‘SDA(쓰다)’ 사례l AI 데이터 가공 사업 : 부끄러운 피임약 상담, 망설이지 말고 AI 약사에피임약 관련 약학 데이터 수집 및 가공약국 방문 없이도 언제 어디서든 AI 전담약사를 통해 피임약 상담이 가능한 의료챗봇 개발에 활용l AI 데이터 가공 사업 : 반려동물 생체신호 웨어러블 디바이스 및 비대면 진단 서비스 플랫폼반려견 행동 데이터 가공 및 모델링반려견의 질병 징후 및 행동 예측 , 비대면 진단 서비스에 활용l AI 데이터 가공 사업 : 국내 최초의 보건의료인을 위한 심리·정서적 지원 챗봇보건의료인력 코칭 데이터 가공 및 모델링보건 의료인력의 정서적 회복과 근무만족도 향상을 위한 24시간 비대면 코칭 챗봇 개발 및 전문 코치들의 코칭 보조 도구로 활용l AI 데이터 가공 사업 : 디지털 정신건강관리 서비스를 위한 AI챗봇 솔루션 사업화청소년 상담 데이터 가공 및 모델링청소년 상담 보조 도구 및 청소년 디지털 정신건강관리 AI챗봇 개발에 활용l AI 데이터 가공 사업 : 의료서비스 질 향상을 위한 리얼 환자경험평가 AI 솔루션 개발환자 병원 방문 리뷰 데이터 가공 및 모델링환자와 보호자에게 양질의 의료서비스 정보를 전달하고, 의료기관에서는 의료 질과 서비스 개선, 병원 운영 효율화 분석 데이터로활용l AI 데이터 가공 사업 : 두피 질환성 탈모인을 위한 생활습관 관리형 챗봇탈모 전문 의료 데이터 가공 및 모델링탈모 고객 맞춤형 정보를 제공하는 AI 챗봇 개발에 활용l AI 챗봇 구축 사업 : 이비인후과 전문 의료상담 AI 챗봇이비인후과 질환 관련 데이터 구축 및 챗봇 개발Q&A Set 20,000건 이상 / 시나리오 100종이상 / 특화 사전 및 엔티티 구축하여 챗봇 개발에 활용l AI 데이터 구축 사업 : 피부 만성 질환자를 위한 코디네이터 챗봇피
(주)플레이그라운드 소개
- (주)플레이그라운드은 2018-12-06에 설립되었습니다.
- 주소 : 서울 강서구 공항대로45길 71 씨에이치빌딩 4층
- 주요 서비스 : 주요 서비스음악 및 사운드 디자인
– Music : 모든 장르의 콘텐츠 음악 작곡 및 편곡 고품질 제작
– Voice Recording : 현지화 및 수출 콘텐츠 별 특징을 반영하여 전문 성우 녹음 제작
– Sound Directing : BGM, Music & Effect 등 고객 맞춤 사운드 디렉팅 및 제작
– Audio Mixing : 전반적인 오디오의 품질 향상으로 오디오 콘, 음략, 이펙트 검수 및 조합 믹싱게임 및 애니메이션
– 사운드 디자인 : 국내외 게임, 애니메이션 현지화 및 수출 제작 (극장판, 시리즈, 7.1ch 등 모든 콘텐츠)
– 더빙 및 음성 수주 시 프로젝트 세부 견적 제공 - 보유 솔루션 : ※국내 최대 면적 전용 녹음실 ” 300평” 운영(7.1 믹스 룸 / 대형 룸 / 중형 룸 / 소형 룸(2개)/ 클라이언트 룸 / 믹스 & 편집 룸/ 별도 촬영 공간)
– 대형 룸 : MAC protools 기반, 고품질 마이크 사용, 25명 동시 녹음 가능
– 중형 룸 : MAC protools 기반, 고품질 마이크 사용, 15명 동시 녹음 가능
– 소형 룸 : MAC protools 기반, 최대 3명 녹음 가능, 내래이션 및 오디오 북 녹음 전용 - 품질 확보 전략 : 품질 확보 전략
– 수요기업의 수정 요청 사항을 적극적으로 반영하며, 결과물 인도 후 6개월 이내 오류 및 품질 향상을 위한 무상 A/S 제공
– 수요기업으로부터 ‘최종 검수 승인서’를 발급받은 후, 가공비용을 정산받음으로써 높은 품질의 서비스 제공 - 유지보수 전략 : 유지보수 전략
– 초과 수요 발생 시, 부서 간의 업무 협력을 통해 유연하게 대처
– 초과 수요 기간이 장기로 넘어가는 경우, 신규 인력 확보를 통해 가공 업무의 효율성 강화
– 프로젝트 단위로 1대1 전담 담당자 지정을 통한 맞춤 코디네이터 - 카테고리 구분 : 전처리,정보추출또는조합,태깅또는라벨링
- 실적 : 실적<;한국콘텐츠진흥원 게임더하기 사업> 참여 中
– 게임더하기 사업의 현지화 및 마케팅 협력사로 등록 후 게임개발사들의 국내외 서비스진출을 위한 더빙 서비스 제공 8건 완료 - 기업 개요 및 핵심역량 : 기업 개요애니메이션, 드라마, 게임, 영화 등의 콘텐츠 BGM, ME, 사운드 및 더빙 믹싱 제작
- 활용 사례 : 주요 기술 및 활용 예시
– 주요 기술 : 전문 더빙 & 믹싱 & 종편 One stop solution으로 클라이언트에게 제공할 역량을 보유
– 활용 예시 : 전문 게임 더빙 제작 / 애니메이션 ME 제작 / CF /사내 방송 / 오디오 드라마 등 다수 (게임, 애니메이션, OTT 플랫폼 등 다양한 영역에서 활용 가능)
(주)코이노 소개
- (주)코이노은 2000-05-19에 설립되었습니다.
- 주소 : 서울 강서구 마곡중앙12로 29 (코이노빌딩)
- 주요 서비스 : (
1)제조 공정관리 비용절감 및 생산 환경 안정화 서비스(Remote Operating System)
-설비 제어PC실시간 모니터링 및 통합관리
-설비 장애 알림 연동 및 사후관리
-제조 공정 로그 데이터 관리로 장애 발생시 원인 분석 데이터 제공(
2)데이터 수집 및 연동,요구사항에 맞는 원본데이터 수집 및 가공업무.(3)데이터 전처리,원본 데이터와 이상치/결측치 처리 및 요구사항에 정해진 포맷으로DB화(4)데이터 통합 및 표준화,개인정보 익명 및 비식별화 작업(5)시각화 챠트 그래프 분석 대시보드 변환 및 시각화 처리 서비스(6)데이터 품질관리
-업종별,업무 영역별 데이터 표준화 및 품질개선(데이터 무결성)
-데이터 활용성 향상을 위한 데이터 속성 추가를 위한 데이터 수집 및 가공 - 보유 솔루션 : 보유솔루션(S/W)1.
애니서포트(AnySupport) : 원격지원 솔루션으로 어떤한 환경(통신, 장소등)에서도 네트워크를 통해 비대면으로 고객의 PC, 스마트폰, 등의 단말장치를 제어하는 솔루션.2.링크미마인(LinkMeMine) : 원격제어솔루션으로 네트워크를 통해 원격지의 단말장치를 제어할 수 있는 솔루션으로 무인단말기 등의 상태를 UI형태로 모니터및 관리를 할 수 있는 솔루션.3.피씨애니프로(PcAnyPro) : 위의 ‘링크미마인’솔루션의 기능을 가지고 있고 소상공인이나 개인을 위해 최적화된 솔루션.4.유씨투게더(UCtogether) : 위의 모든 솔루션을 가지고 있고 더불어 비대면 화상기능도 포함하고 있음. - 품질 확보 전략 : 품질 보증 목표는 가공 데이터가 사용자의 요구사항을 충분히 만족하였는지, 가공데이터의 신뢰성, 효율성등을 사전에 확인하고 미비사항 발견시에는 미비사항을 보완하여 사업기간내에 데이터 가공 활용목표를 달성하도록 관리하기 위함임.품질 전담 조직을 통해 철저한 품질 보증 활동을 담당하며 데이터 품질검사를 통하여 결함 발견시에는 시정조치를 통해서 고객의 충족여부를 확보할 것임.(
1)품질관리절차데이터 가공계획
–
–
–
-> 데이터 품질관리활동
–
–
–
-> 데이터 품질검토
–
–
–
-> 데이터 검토및 시정조치
–
–
–
-> 수요기업인수
–
–
–
-> 사후관리(
2)데이터 가공 품질관리 내용
– 데이터 가공계획 : 데이터가공계획을 수립(데이터 가공 요구사항정의 및 품질보증 계획 수립)
– 사업관리 : 가공데이터의 원천데이터와 가공데이터의 요구사항 항목의 변경 사항을 통제하여 상태를 기록, 유지함.
– 워크스루 및 데이터감시 : 사업 수행단계에서 정기적인 회의체를 운영하여 데이터 품질 검토와 개선사항 필요시 시정조치를 통해 완성도를 높임.
– 무상유지보수 : 데이터가공 및 고객인도 후 6개월간 고객의 데이터 활용 상태를 점검하고 납품 데이터 유지보수 지원. - 유지보수 전략 : 1) One Stop 서비스를 통하여 데이터이 정합성과 유효성을 지속적으로 관리할 수 있도록지원 체계를 갖추워 지원함.
One Stop 의 의미는 수요기업의 IT 및 비즈니스 환경에서 발생할 수있는 유지관리체계를 지원하게 됩니다.
2) 유지보수 대상물에 대한 구체적인 정의 및 범위와 기간을 구체적으로명시한후 데이터의 가공 대상사업의 환경적 , 기술적 특성을 이해하는 유지보수 책임자를 지정하여 하자보수 및 장애 발생에 대해신속하게 대응할 수 있는 체계를 유지하며 아래와 같은 지원체계를 유지함.역할 업무 분장유지보수 책임자보수내용 접수 및 지원 창구유지보수 인력 및 일정 관리 유지보수 담당자 제공된 가공서비스의 결함등에 대한 하자보수수행3) 유지보수의 내용구분내용 유지보수 대상 공급할 목적물의 모든 구성요소 무상유지보수 대상공급한 목적물에 하자가 있는 경우는 무상유보수를 원칙으로 함
– 수요기업 인수 확인 후 6개월 이내에 발생하는 데이터 결함에 대한유지보수내용 무상유지보수 기간에 발생하는 가공데이터의 결함등에 대한 하자보수데이터 변동 (분석 대상에 속한 항목의 추가 및 조정 , 시계열의 변화)데이터 분석결과의 해석 및 검증에 대한 가설 확인 필요시 재분석 및 수정 보안 작업 유상유지수보대상무상 제공범위를 벗어나는 데이터의 추가 제공등에 대한 활동내용 신규 데이터의 추가 및 기존데이터의 구성변경등을 실시할 경우 상호 협의하여 실비 제공을 원칙으로 함 무상 하자 보수 기간 중 신규 기능을 추가하고 기존의 시스템을 개선하는 경우 수요기업의 시스템의개조, 추가, 조정 및 수리로 시스템에 중대한 영향을 끼치는 경우 유상제공을 원칙으로 함 4) 유지보수 지원 단계 유지보수 접수시 수요기업의 담당자와 커뮤니케이션을 통해 고객의 사용환경 및 유지보수 접수내역을분석 후 지원 유형을 분류하여 즉시처리가 가능한 업무는 신속하게 처리하며, 데이터 가공등에 대 한 변경 사항 발생시에는 수요기업에게 데이터의 가공전달 이전에 추가 및 수정사항등에 대한 내용을명확하게 명 - 카테고리 구분 : 전처리,시각화,정보추출또는조합
- 실적 : 데이터 가공 실적 없음.
- 기업 개요 및 핵심역량 : 1.기업개요(
1)㈜코이노는 PC,Mobile 에 대한 원젹제어 및 음성, 영상 채팅 솔루션과 서비스를 제공하고 있으며 클라우드 및 제조 및 수주 산업에 대한 IOT 기술영역으로 사업을 확장하고 있음.(
2)연구 중심 인력구성으로 전체인원의 약73%가 전문 개발인력이며 중급이상의 기술인력이공공기관 및 금융기관가지 다양한 구축경험을 바탕에 둔 기술인력 중심이며IOT 및 Data 시각화와 비대면 기술분야에 협력관계 및 협업을 추진하는 업체를 계속 확대하고 있음.(3)특허등록 22건, 특허출원 8건을 보유한 S/W기술전문기업임.2.핵심역량(
1) 제조 공정관리 비용절감 및 생산 환경 안정화 서비스 (Remote Operating System)
– 설비 제어 PC 실시간 모니터링 및 통합관리
– 설비 장애 알림 연동 및 사후관리
– 제조 공정 로그 데이터 관리로 장애 발생시 원인 분석 데이터 제공(
2) 데이터 수집 및 연동 , 요구사항에 맞는 원본데이터 수집 및 가공업무.(3) 데이터 전처리 , 원본 데이터와 이상치 / 결측치 처리 및 요구사항에 정해진 포맷으로 DB화 (4) 데이터 통합 및 표준화 , 개인정보 익명 및 비식별화 작업(5) 시각화 챠트 그래프 분석 대시보드 변환 및 시각화 처리 서비스 (6) 데이터 품질관리
– 업종별, 업무 영역별 데이터 표준화 및 품질개선 (데이터 무결성)
– 데이터 활용성 향상을 위한 데이터 속성 추가를 위한 데이터 수집 및 가공 - 활용 사례 : 보유한 솔루션을 통해 다량의 데이터를 수집 가공하여 유지보수, 제품개발 등에 활용을 할 수 있는데 실시간으로 수집되는 각종 이벤트 데이터를수집, 가공하여 제품의 개발이나 유지보수에 활용을 할 수 있음.
(주)데이터누리 소개
- (주)데이터누리은 2018-10-25에 설립되었습니다.
- 주소 : 서울 강서구 마곡중앙1로 20 마곡엠시그니처 516호
- 주요 서비스 : o 가공 업무 프로세스
– 수요기업의 명확한 데이터 가공 요구사항을 분석하여 활용 목적에 맞는 가장 적합한 형태로 데이터셋을 가공구축하여 제공하고 요청에 따라 분석 결과 제공① 데이터 가공만 요청 시 : 정제/표준화 → 가공/연계융복합 단계를 진행 후 가공 데이터셋 제공② 데이터셋 가공 및 분석 요청 시 : 정제/표준화 → 가공/연계융복합 → 분석/컨설팅 단계 진행 후, 데이터셋 및 분석결과 제공③ 데이터 분석만 요청 시 : 분석/컨설팅 단계만 단독 진행 후 분석결과 제공 비식별 조치 단독 또는 ①, ②, ③ 요청 중 비식별 조치를 요청 시 : 요청 내용에 따라 진행 후 비식별 데이터셋 제공 o 가공 방법론
– 데이터 관련 사업 수행 경험을 통해 수립된 데이터 가공방법론을 적용하여 최고 데이터 서비스 제공
– 데이터 가공업무를 분석/설계/구현 등 체계적인 절차에 따라 관리하고 실행 ① 데이터 가공 업무 단계 분석
– 데이터 가공 업무를 단계별로 활동을 정의하고 각 단계별로 수행해야 할 업무 내용을 분석하여 기술 ② 데이터 가공 설계
– 가공업무 종류를 데이터 다듬기(식별, 추출, 정제), 데이터 개선(대체, 보강, 보정, 투영), 데이터 변환 및 데이터 검증으로 구분하여 관리③ 가공업무 구현
– 가공 설계에 따라 스크립트 등을 활용하여 가공업무를 반자동화하고 효율적, 체계적으로 관리하여 높은 품질의 결과물을 제공유형기술기초 데이터 가공 개요 : 입수된 원천데이터의 데이터 상태에 따른 기초적인 수준의 가공 가공기술 : 데이터 상태에 따라 정제 및 변환, 데이터 전처리 로직 구현, 원천데이터에 내재하는 데이터의 불일치성을 교정(오류데이터 제거, 위치 좌표 보정, 상태 값 보정 등)주소정보 가공 개요 : 주소지 주변의 다양한 정보를 활용하기 위해 주소 정제 및 코드화(키값 생성 가공기술 : 주소정제, 주소코드화, 실주소식별, 신구주소변환, APT/건물코드부여연계/융합 가공 개요 : 데이터를 가공하여 사용자가 활용 목 - 보유 솔루션 : ① 개인정보 비식별 조치 솔루션(Identity Shield)
– (업무) 가공 데이터에서 개인정보 및 민감정보를 검출하고 비식별조치를 할 수 있는 솔루션으로 안전한 데이터 활용을 위한 데이터 비식별 처리 가공② 데이터 분석 플랫폼(VERTICA)
– (업무) 고성능의 데이터 처리 및 손쉬운 머신러닝 알고리즘 활용을 통한 AI 분석 기능을 제공하는 솔루션으로 연계/융합 데이터 가공, AI 데이터 가공 및 분석 등 활용③ 데이터 분석 솔루션(데이터누리)
– (업무) 기본적인 데이터 가공 및 처리와 통계, AI 분석 알고리즘 등 분석 환경을 제공하는 솔루션으로 기본적인 데이터 가공/처리 및 분석 등에 활용④ KNIME(오픈SW)
– (업무) 데이터 전처리, 품질 및 텍스트 마이닝, AI 분석 알고리즘 등 분석 환경을 제공하는 솔루션으로 기본적인 데이터 가공/처리 및 분석 등에 활용⑤ 데이터추출 솔루션(자체개발)
– (업무) 정형비정형 데이터를 수집, 전처리, 적재하는 일련의 기능을 제공하는 솔루션으로 데이터 수집, 추출, 융합, 연계 등에 활용⑥ 어노테이션툴(자체개발)
– (업무) 크라우드 소싱의 작업 성격에 부합하는 맞춤 클라우드 기반의 웹 적용형 어노테이션 툴로써AI 데이터 학습을 위한 전반적인 프로세스 중 ‘데이터준비 및 어노테이션’ 구간에 툴을 활용 - 품질 확보 전략 : o 신규 데이터 인력(경력, 신입 등) 추가 확보
– 신입 및 경력직 신규 데이터 가공/분석 인력 추가 확보 추진 중(3명 이상)
– 협력 관계인 대학(한신대, 경희대 등)과 데이터 전문인력 확보를 위한 취업연계 인턴쉽 프로그램 참여 추진 ※ 인턴쉽 프로그램으로 기본 기술력을 보유한 검증된 신규 인력을 본사 취업과 연계하여 데이터 인력 확보 o 데이터 가공 방법론 구체화를 통한 품질 확보 및 납품일정 준수
– 신규 데이터 인력 신속한 현업 투입 및 인턴쉽 참여 인력의 체계적인 현업 교육을 위한 데이터 가공 프로세스/기술 방법론을 구체화하여 적용
– 구체화된 데이터 가공 프로세스/기술 방법론 적용으로 균일한 데이터 가공 품질을 확보하고 가공 데이터 납품일정 준수 o 컨설팅 전문인력을 통한 고객 관리 및 고객 응대 체계화
– 빅데이터 컨설팅 전문인력을 활용하여 고객의 요구사항을 체계적으로 파악하고 지속적인 커뮤니케이션을 채널 확보
– 컨설팅을 통한 고객의 요구사항이 데이터 가공 전체 단계뿐만 아니라 사후관리 (기술지원) 단계까지 원활히 반영될 수 있도록 관리 - 유지보수 전략 : □ 수요기업 유지보수 방안 o 데이터 가공 서비스 후속 지원
– 사업의 성공적 수행 이후 안정적인 후속 지원을 도모하고 이를 위한 체계를 구축하여 원활한 하자 및 유지보수 진행
– 사업 종료 후, 장애 발생에도 유연하게 대처할 수 있도록 세부 방안을 수립하여 수요기업의 만족도를 극대화
– (계획수립) 신속한 하자보수 처리 절차를 수립하고, 해당 사업 참여인력을 중심으로 유지보수 인력 투입
– (단일화) 사업 종료 후 제안사의 유지보수 전담 창구를 구성하여 수요기업의 요구사항 전달 및 대응을 단일화 함으로써 신속하고 효율적으로 유지보수 실시
– (변화관리) 계획을 실행함에 있어 추진상에서 발생되는 문제점 및 애로사항에 대하여 지속적인 자문 활동을 실시함으로써 성공적인 사업 실행이 이루어질 수 있도록 함
– (교육지원) 제공 데이터 및 관련 서비스에 대한 체계적인 교육계획 수립 및 지원 - 카테고리 구분 : 전처리,품질,시각화,정보추출또는조합,태깅또는라벨링,기타
- 실적 : 과제명수행기간발주처총 사업비(천원)매출실적(천원)메타데이터 관리 시스템 구축2022.08~ 2022.12㈜아이티스마트290,000290,000빅데이터/AI 기반의 법률 서비스 플랫폼2022.06~ 2022.11한국데이터산업진흥원(㈜록션)70,00070,000구강세균 감염으로 인한 치과질환 진단·관리 서비스 개발2022.06~ 2022.11한국데이터산업진흥원(이대목동부속병원)70,00070,0002022년 공공부문 이용 SaaS 개발·검증 과제2022.06~ 2022.12한국지능정보사회진흥원200,000200,000스마트그리드 연계형 e
-Mobility 대용량충전 Hub 빅데이터센터 구축사업2022.01~ 2022.12한국지능정보사회진흥원(펌프킨)100,000100,000자동차 부품 관리 플랫폼 구축(광주)2021.12~ 2022.01한국자동차연구원154,000154,000안양시청 AI 빅데이터 분석 플랫폼 구축2021.09~ 2022.06안양시청99,00059,4002021년 데이터바우처 일반가공 1건/AI가공 1건2021.07~2021.12한국데이터산업진흥원12,00012,0002021년 빅데이터 센터 구축 사업2021.07~2021.12한국지능정보사회진흥원(펌프킨)450,000210,0002021 인공지능 학습용 데이터 구축(2차) 사업(부품 품질검사)2021.06~2021.12한국지능정보사회진흥원(㈜미래아이티)3,600,000180,0002021 인공지능 학습용 데이터 구축(2차) 사업(수산 양식업)2021.06~2021.12한국지능정보사회진흥원(㈜바인드웍스)1,800,000180,0002021 인공지능 학습용 데이터 구축 사업(뇌 영상)2021.06~2021.12한국지능정보사회진흥원(가천대 산학협력단)3,360,966435,000해양수산부 빅데이터 활성화 용역2021.05~2021.12해양수산부(데이터스트림즈)130,00053,253공공기관 민간클라우드 전환 컨설팅2021.05~2021.12한국지능정보사회진흥원(브이텍)3,420,00086,363대용량 - 기업 개요 및 핵심역량 : o 데이터 통합, 분석 및 활용을 통해, 고객이 만족하는 최적의 솔루션을 개발구축하여 데이터 활용성이 극대화된 데이터 표준 플랫폼을 구축하여 데이터 분야 최상의 길잡이가 되는 것을 목표로 설립
– 데이터의 공유, 활용에 특화된 데이터 플랫폼 및 AI 학습용데이터 구축을 위한 인공지능 플랫폼을 주력사업으로 운영하고 있으며, 그 외 데이터 가공 및 데이터 인프라 구축 컨설팅 등의 서비스를 제공o 오픈데이터 플랫폼 Metis는 국제표준(DCAT) 데이터 관리 체계를 기반으로 한 통합 오픈데이터 플랫폼솔루션으로 클라우드 환경을 통한 뛰어난 접근성과 데이터 연계 및 데이터 품질 향상을 위해 만들어진 솔루션 - 활용 사례 : 과제명수행기간발주처(주관기업)총 사업비(천원)비고구강세균 감염으로 인한 치과질환의 자동진단 및 자가관리 시스템의 개발2022.06~2022.11한국데이터산업진흥원(이대목동부속병원)70,000수행중 ㅇ 자체 개발한 어노테이션 툴을 통해 구강 이미지 데이터를 인공지능 학습용데이터로 구축하기 위한 라벨링 작업 진행
– 약 2.5만건의 데이터 구축 지원빅데이터/AI 기반의 법률 서비스 플랫폼2022.06~2022.11한국데이터산업진흥원(㈜록션)70,000수행중ㅇ 법률승소 사례 데이터를 자체 수집하여 자연어 처리를 위한 형태소 분석을 하여 인공지능 학습용데이터로 구축
– 약 6만건의 데이터 구축 지원2021 인공지능 학습용 데이터 구축(2차) 사업(부품 품질검사)2021.06~2021.12한국지능정보사회진흥원(㈜미래아이티)3,600,000완료 ㅇ 자체 개발한 어노테이션 툴을 통해 차량 및 선박 부품 데이터를 인공지능 학습용데이터로 구축하기 위한 라벨링 작업 진행
– 약 40만건의 데이터 구축 지원2021 인공지능 학습용 데이터 구축(2차) 사업(수산 양식업)2021.06~2021.12한국지능정보사회진흥원(㈜바인드웍스)1,800,000완료 ㅇ 자체 개발한 어노테이션 툴을 통해 수산 양식업 먹이생물 데이터를 인공지능 학습용데이터로 구축하기 위한 라벨링 작업 진행
– 약 5만건의 데이터 구축 지원2021 인공지능 학습용 데이터 구축 사업(뇌 영상)2021.06~2021.12한국지능정보사회진흥원(가천대 산학협력단)3,360,966완료ㅇ 각 사업의 데이터 특성에 맞게 커스텀된 자체개발 어노테이션 툴과 크라우드워커 관리 플랫폼을 활용하여 인공지능 학습용데이터 구축 사업 진행인공지능 기반 상황인지 적응형 스마트 컨시어지 서비스 개발2021.
06~ 2021.
11한국데이터산업진흥원(㈜나스카랩)70,000완료ㅇ AI 도입이 시급한 주문 중개 분야에서 AI 기술을 적용하여 주문을 자동처리하거나 통화상담이 가능한 인공지능 기반 상황인지 적용형 스마트 컨시어지 서비스 개발
– 자사
주식회사 플롯팩토리 소개
- 주식회사 플롯팩토리은 2023-01-01에 설립되었습니다.
- 주소 : 서울 강서구 마곡중앙2로 11 303호
- 주요 서비스 : 1.
데이터 수집 및 가공 솔루션온/오프라인 상에 존재하는 다양한 데이터를 수집하고 이를 기반으로 서비스를 개발 및 고도화를 위한 전처리, 데이터 분석 등을 제공하는 솔루션입니다.
(
1) 제공서비스온라인 데이터 수집 및 알고리즘 구현오프라인 데이터 수집전처리 / 데이터 분석 (
2) 주요 기술크롤링 / 데이터 라벨링데이터베이스 구축데이터마이닝데이터 아키텍처 구축2.
자연어처리(NLP) 솔루션
-음성 인식, 내용 요약, 번역, 사용자의 감성 분석, 텍스트 분류 작업(스팸 메일 분류, 뉴스 기사 카테고리 분류), 질의 응답 시스템, 챗봇 개발 등 다양한 언어 기반의 데이터를 가공하여 서비스화 지원하는 솔루션입니다.
(
1) 제공 서비스언어 교육용 AI 자동 채점 및 평가 솔루션한국어 교육용 인공지능 챗봇, AI 자동평가 솔루션 개발AI 한
-영 번역 솔루션데이터 시각화AI 기반 챗봇 솔루션 (
2) 주요 기술Natural language generation (자연어생성)Dialogue generation (대화 및 응답 생성 기술)Text classification (텍스트 분류)Auto conjugation(Stemming, Lemmatization)Grammatical error correction Named Entity Recognition (객체명 인식)모델 아키텍처 구축 및 파인튜닝 기술3.
컴퓨터 비전컴퓨터를 통해 이미지, 비디오 및 기타 입력에서 정보를 추출할 수 있도록 하는인공지능 기술로 자율주행, 이미지 판별 등 다양한 솔루션을 제공합니다.
(
1) 제공 서비스이미지 처리이미지 데이터 가공 솔루션 (
2) 주요 기술CNN객체 인식 / 객체 분류4.소프트웨어 프로그램 개발앱/웹, 시스템, 보안 등 다양한 기술을 개발하는 솔루션입니다.
(
1) 제공 서비스앱/웹 소프트웨어 개발MES / ERP 시스템 구축웹/앱 디자인 솔루션 제공 (
2) 주요 기술프론트엔드 개발백엔드 개발웹/앱 디자인 개발 - 보유 솔루션 : 1.
보유 솔루션가공 데이터특화 가공 서비스공통 가공 서비스자연어 처리(NLP)언어 교육용 AI 자동 채점 및 평가 솔루션한국어 교육용 인공지능 챗봇, AI 자동평가 솔루션 개발한
-영 번역 솔루션데이터 시각화AI 기반 챗봇 솔루션문장 자동 생성, 자동 조사 결합, 어미분석을 통한 시제 적용, 한국어 예외 문법 처리(ex.
ㅂ탈락, ㄴ탈락)형태소별 자동 태깅 시스템 자체 구축데이터 수집온라인 데이터 수집 알고리즘오프라인 데이터 수집전처리데이터 분석컴퓨터 비전이미지 처리이미지 데이터 가공 솔루션데이터 수집온라인 데이터 수집 알고리즘오프라인 데이터 수집전처리데이터 분석2.
가공기업 기술 및 가공 프로세스(
1) 데이터 수집 자체 플롯팩토리 크롤매니저 개발 완료
-원활한 데이터 수집을 위해 플롯팩토리에서 자체 개발한 크롤매니저를 구축함.
– 플롯크롤매니저 모듈을 자체 개발하여 인터넷상에 존재하는 모든 데이터를 수집할 수 있도록 하였음.<;플롯크롤매니저 주요 기능>
– 리퀘스트크롤러(http request) : 일반적인 크롤링 방식으로, post, get을 통하여 bs4객체 반환.
– API크롤러(json type) : API로서 JSON 데이터를 응답하는 시스템에 적용.
– 브라우저크롤러(Selenium) : Javascript가 생성하는 VirtualDom 방식의 웹구조를 크롤링하기 위함.
– 헤드리스크롤러(Selenium) : 브라우저크롤러의 브라우저를 백그라운드 베이스에서 실행하기 위함.
– 딥웹크롤러(Thor) : 프록시를 설정하여, 토르를 통하여 딥웹을 크롤링할 수 있는 기능 (*범죄데이터 수집시)<;그 외에도 상황별 적용 가능한 옵션 개발을 완료함.>
– 자동 VPN 탐색 및 적용 기능(ByPassIPBlock), Dummy 태그 제거 옵션(ClearDummyTricks), 캡차우회 오션(ByPassCaptcha), 클라우드플레어 우회 옵션(ByPassCloudFlare)
– 그 외에도 User
-Agent switching, 헤더값 설정 옵션, JWT - 품질 확보 전략 : 1.
데이터 처리 전문 인력 및 분야별 전문 인력 배치를 통한 품질 강화
-플롯팩토리는 각 산업의 전문 인력을 배치하여 산업에 이해도가 높은 데이터를 구축해나가고 있음.
– 일례로 한국어 교육 데이터 구축을 위해 한국어 교육 전문 인력을 배치하여 비즈니스와 연결할 수 있는 데이터 품질을 확보하고 있음.
– 뿐만 아니라 데이터 검수, QA체계 구축, 품질 테스트를 진행하고 있는 품질관리 본부를 따로 부서 배치하여 품질확보에 힘쓰고 있음.
– 필요한 경우, 외부 전문가 소싱을 통해 판매 데이터의 품질을 확보해나갈 계획임.2.
데이터 가공 업무 프로세스 구축
– (1단계.
요구사항 파악) 고객 요구사항 파악 / 담당자 배정 / 자체 데이터 요청폼 전달
– (2단계.
데이터 수집) 온/오프라인 데이터 수집 / 크라우드 소싱 / 웹 크롤링
– (3단계.
데이터 가공) 데이터라벨링 / 전처리 / AI 모델링 구축
– (4단계.
데이터 검수) 데이터 테스트 / 데이터 품질 관리 / 고객 피드백3.
데이터 구축 전문 조직 체계 구성
-데이터 사업, 품질관리, 사업운영, 영업/마케팅으로 구성된 4개의 본부 운영을 통해 수요기업 맞춤형 조직 운영 체계를 구축함. - 유지보수 전략 : 1.
수요기업별 전담인력 배정을 통한 사후 관리 체계 구축
– 수요기업에 데이터 공급을 진행한 뒤, 지속적인 사후 관리를 위한 전담 인력을 배정함.
– 유지보수 및 보안과 같은 데이터 운영 방안과 관련된 세부 사항을 지속적으로 관리하여 수요기업이 데이터를 지속적을 관리할 수 있도록 체계를 구축함.2.
데이터 활용 방안 및 서비스 고도화 컨설팅
– 수요기업에 맞춤화된 데이터 구축뿐만 아니라 데이터를 활용하여 비즈니스를 다각화할 수 있는 다양한 솔루션을 공급함.
– 플롯팩토리는 가죽 공방 도면 데이터를 관리 및 활용하고 있는 ‘어웰즈‘의 경우, 도면 이미지 데이터를 제공한 뒤, 도면 데이터를 관리할 수 있는 ERP, MES 시스템을 공급하여 공방 수요자별 맞춤형 도면 자동화 솔루션을 공급한 전례를 가지고 있음.
– 본 시스템 구축처럼 데이터를 활용할 수 있는 다양한 시스템 구축 컨설팅을 통해 수요기업의 비즈니스를 이바지함.3.
기업 네트워크를 활용한 기업 간 협업 체계 구축
– 본 기업은 대표자의 네트워크를 활용하여 초기 데이터 개발외주 기업을 모집한 경험을 보유하고 있으며, 개발외주 고객사들의 협업기업 매칭을 통해 MOU 체결을 도운 전례도 보유하고 있음.
– 대표자가 보유하고 있는 네트워크를 통해 수요기업 간 협업 체계를 구축하고자 함. - 카테고리 구분 : 전처리,품질,코딩,시각화,정보추출또는조합,태깅또는라벨링,분석,기타
- 실적 : 1.
2022년 스마트공방 기술보급 사업
– 어웰즈 / 가죽 공방을 만드는 어웰즈에 사용자 맞춤형 ERP 솔루션을 개발함.
주요 ERP 모듈로는 사용자별 이미지 데이터, 가죽 제작에 필요한 도면 데이터 수집 및 관리 기능, 재고 및 자재 관리 솔루션을 공급함.2.
2021년 콘텐츠 스타트업 리그 (문체부 / 한국콘텐츠진흥원)
– 플롯팩토리 / 자체 서비스인 빅데이터 기반 한국어 교육 플랫폼, 뉘앙스를 개발함.
– 온라인에서 수집한 비정형 한국어
-영어 말뭉치 데이터를 가공하여 외국인의 한국어 교육을 위한 교육용 데이터로 가공하여 서비스를 론칭함.
– 한국어 형태소 분석 태깅 시스템 활용하여 Auto conjugation(Stemming, Lemmatization) 자체 구축 특허 출원 진행 중에 있음.3.
데이터 구축 및 소프트웨어 시스템 개발 외주
– 2021년, 2022년 / ㈜콘XXX듀 수학 교육을 위한 온라인 보드게임, “숫자전쟁” 앱/웹 소프트웨어 솔루션을 공급함.
보드게임의 수리적 교육 연관성 분석을 위해 게임 승률 데이터, 학생별 수리 능력 향상 데이터 수집 알고리즘을 구축 완료함.
– 2022년 / 법무법인 XXX비 법무법인 케이앤비에서 변호인이 사용할 수 있는 법령, 행정규칙, 자치법규, 판례, 법령해석례, 행정심판례, 헌재결정례 등 법령정보를 수집 및 가공함.
추가적으로 법무법인 케이앤비 웹 시스템 공급도 진행함.
– 2022년 / ㈜XXX경제 뉴스 기계번역을 위한 한국어 빅데이터 수집 및 가공 외주 용역을 진행함.
/ 말뭉치 데이터 공급을 통해 기계번역의 성능 향상을 도모함.
– 2022년 / ㈜XX어스 NFT 개발기업인 미디어스의 웹 디자인 개발을 진행함.
이미지 데이터 중심인 NFT 플랫폼의 특성을 고려해 사용자 친화적인 디자인을 개발 완료함.
– 2022년 / XX키즈 아동교육 플랫폼 아티키즈의 서버구축, 개인정보 암호화 및 앱 시스템 구축을 진행함. - 기업 개요 및 핵심역량 : 1.
기업 개요
– 플롯팩토리는 AI 및 알고리즘 구현 전문 기업으로, 자연어처리 및 이미지처리 부분에 대한 데이터 수집, 전처리, 가공과 관련하여 다양한 기업의 솔루션을 개발하고 있음.
– 특히, 다년간 AI 기반 언어 교육 서비스를 운영하고 있는 대표자는 언어 교육과 관련된 교육용 인공지능 챗봇 개발, 한국어 문장 자동 첨삭 및 번역 시스템 등 NLP 모델 및 데이터 가공에 대한 전문성을 보유하고 있음.2.
주 사업분야
– 플롯팩토리는 데이터 수집 및 가공, NLP 및 컴퓨터 비전에 관련된 AI 솔루션, 소프트웨어 프로그램 개발 등 다양한 IT 관련 사업을 운영 중에 있음.3.
주요 서비스
– 자연어처리 및 컴퓨터 비전 관련 빅데이터 구축 및 AI 개발 외주
– 소프트웨어 프로그램 개발 외주 - 활용 사례 : 1.
기 개발한 데이터를 활용 시스템 결과물 활용 사례
– 플롯팩토리는 제공한 데이터 가공서비스를 활용하여 추후 데이터를 활용할 수 있는 시스템까지 구축 가능함.
– 실제로 기 가공한 데이터를 활용하여 생산관리시스템, 수학 성취도 평가 앱, 한국어 교육 앱 등을 개발한 경험을 보유하고 있음.
– 고객이 데이터 가공에서 끝나는 게 아니라 데이터로 실제 비즈니스 운영을 할 수 있는 상품까지 개발 가능함.(데이터 활용예시
1) 어웰즈 도면 이미지 데이터를 활용한 사용자 셀프 디자인 MES 구축
– 고객이 요청하는 도면 데이터를 받아 개인 맞춤형 핸드백, 가방, 가죽 제품을 제작하는 기업임.
– 도면 이미지 빅데이터를 구축하고, 이를 통해 맞춤형 추천을 제공할 수 있는 셀프 디자인 이미지 시스템을 구축함.(데이터 활용예시
2)㈜콘센트에듀 수학 문제 데이터를 활용한 수학 성취도 평가 앱 구축
– 아이들의 수학 성취도를 평가하고, 재미있게 수학을 공부할 수 있는 온라인 보드게임 “숫자전쟁” 데이터구축 작업을 진행함.
– 산수 데이터를 가공하여 AI 와 게임할 수 있는 온라인 대전 시스템을 구축하여 자동으로 아이들의 학습 성취도를 평가할 수 있도록 함.(데이터 활용예시3) 랭글 한국어 자연어 데이터 구축
– 외국인이 한국어 회화를 공부할 수 있는 앱/웹 기반 한국어 교육 플랫폼임.
– 한국어 말뭉치 데이터를 가공하여 자동으로 문장을 생성하고, 형태소 변형을 자동으로 제공할 수 있는 학습 시스템을 개발함.
주식회사 에프앤가이드 소개
- 주식회사 에프앤가이드은 2000-07-05에 설립되었습니다.
- 주소 : 서울 강서구 마곡중앙2로 61 에프앤가이드빌딩
- 주요 서비스 : 1) 서비스 개요본 서비스는 수요기업의 요청에 맞춰 각종 투자지표를 가공해 주는 서비스입니다.
당사는 금융투자정보 제공 업체로써 금융시장에 필요한 다양한 투자 지표를 가공하여 서비스하는 전문 기업입니다.
현재 다수의 국내외 고객에게 다양한 투자지표(자체생성 혹은 고객 커스텀)를 제공하고 있습니다.
이에는 개별기업에 대한 투자지표 뿐만 아니라 거래소 및 자체적인 산업(업종) 분류 및 이에 따른 업종합산 데이터도 포함됩니다.당사는 정제된 장기 시계열의 재무 및 컨센서스 데이터를 바탕으로 수많은 투자지표를 생성하고 있습니다.
이러한 투자지표 중에는 자체적으로 생성한 것은 물론 대외 고객의 요구에 따라 특화된 지표도 가공하여 송출하고 있습니다.
수요기업의 독자적인 자산배분, 밸류에이션 지표 등에 대한 개념이 있으나 실현되거나 구체화되지 않은 경우 컨설팅부터 시작해서 당사가 보유한 혹은 수요기업이 보유한 데이터를 바탕으로 이를 구체화하고 백테스트까지 가능한 종합적인 가공 서비스 제공이 가능합니다.산업분류의 경우 현재 통용되고 있는 한국거래소의 분류체계는 기업의 주력 사업 변화와 복합기업 등의 특성을 제대로 반영하지 못해 투자 실무에 적용하기에는 한계가 있습니다.
정확한 투자와 성과 평가를 위해서는 이러한 분류체계 재정립이 필수적이며, 당사는 이미 자체적인 산업분류 체계를 마련하여 시장에 공급중입니다.
이러한 내부 역량을 기반으로 수요기업이 독창적인 산업분류 체계에 대한 가공 서비스를 요구할 경우 당사는 일련의 가공 서비스를 빠르고 효과적으로 제공할 수 있습니다.금융투자지표 가공 서비스의 예시는 다음과 같으며 수요기업의 요구에 맞춰 사전협의를 진행하면서 서비스 제공 가능 여부가 확정됩니다.가) 재무(+잠정실적) 데이터를 이용한 커스텀 밸류에이션 지표 생성나) 재무(+잠정실적) 데이터를 이용한 투자 성과예측 및 백테스트다) 초과수익 달성을 위한 커스텀 컨센서스 생성라) 산업(업종)별 합산 데이터 생성 등 - 보유 솔루션 : 당사는 증권사에서 발표하는 기업의 목표주가, 영업이익 등의 데이터를 이용하여 기업이나 산업의 컨센서스 데이터를 서비스하고 있습니다.
또한 컨센서스 데이터의 정확도를 높이기 위한 다양한 기법을 적용한 스마트 컨센서스도 제공하고 있으며 이런 기법은 수요기업의 비즈니스에 필요한 가공 데이터 산출에 도움이 됩니다.
재무 데이터의 경우 정제 등 전처리 과정을 거쳐 연간, 분기 재무데이터를 산출하여 장기 시계열의 정합성이 높은 데이터를 관리하고 있습니다.
이와 더불어 당사는 현재 자체적인 분류체계에 따라 산업과 기업을 구성하고 구성된 산업기준으로 합산데이터를 생성하고 있습니다.
과거 성과를 측정하는 백테스트 기능이 있으며, 이를 통해 수요기업이 요청한 데이터에 대한 검증이 가능합니다.
수요 기업의 이러한 가공 서비스 요청이 있을 경우 다양한 경험을 바탕으로 효과적인 가공 서비스 제공이 가능합니다.
백테스트는 당사가 보유한 과거 시계열데이터를 이용하여 트렌드 분석, 성과측정에 활용 됩니다. - 품질 확보 전략 : 아래와 같이 데이터 설계, 수집, 정제(전처리), 생성, 검증 등으로 이어지는 일련의 가공서비스 프로세스와 관련하여 각 단계별로 전담 인력을 구성하고 프로세스 관리 및 고객 응대 등 서비스 품질 제고를 위해 지속적으로 관리할 계획입니다.
1)데이터 설계:수요기업 비즈니스 모델 파악, 데이터 특성, 구조 파악/ 가공 데이터 범위, 항목 정의, 일정 수립
2)데이터 수집:데이터 모델링 / 표준화, 데이터 마트 구축, 데이터 현행화3)데이터 정제: 데이터 전처리, 데이터 정제4)데이터 생성: 가공에 필요한 알고리즘 구현, 데이터 가공5)데이터 검증:코딩 에러 검증, 요인별 검증, 수치 이상 검증(필요시 보정) - 유지보수 전략 : 1) 유지보수 계획유지보수 등 고객 응대는 1차적으로 마케팅(정 김유정, 부 이효선)에서 접수하여 당해 업무 부서로 전달 후 직접 혹은 마케팅을 통하여 피드백 및 서비스 반영 등의 절차를 거쳐 수행할 계획이며 당분간 수요 증가에 대응할 충분한 여력을 확보하고 있으며 필요시 충원을 통해 후속지원의 품질을 제고할 계획입니다.
2)수요기업과의 협업체계 전략가공 서비스를 이용하는 수요기업의 비즈니스에 가공 서비스 외에 수요 기업이 독자적으로 구축하기 어려운 데이터 산출에 대해서는 추가적으로 당사가 보유한 금융공학과 관련 노하우를 기반으로 공동개발 또는 업무 제휴 등을 통해 다양한 방법으로 협력할 수 있습니다.
또한 데이터바우처지원사업이 종료된 이후에도 수요기업의 관련 서비스 상품화 과정에서 협업 혹은 계약을 통해 기술지원과 데이터 지원 등을 지속하는 방법으로 협업 체계를 구축할 계획입니다. - 카테고리 구분 : 분석,기타
- 실적 : 당사는 금융투자시장 인덱스(지표) 가공 서비스와 관련하여 최근 3년 이내 대표적으로 아래와 같이 국민연금공단에 지수 가공 서비스를 제공(중)한 바 있습니다.
이와 관련한 대략적인 서비스 내용은 아래와 같습니다.
– 사업명: 국내주식 책임투자형 벤치마크 지수 계약
– 사업내용(역할): 국민연금공단의 국내주식 책임투자 벤치마크 지수산출을 위한 제공기관 선정 및 책임투자 관련 용역 계약
– 거래처명: 국민연금공단
– 계약기간: 2021.07.22.~2024.07.21.(3년)
– 사업금액: 86,298,000원
– 성과: 책임투자 보고서의 작성 및 기존 책임투자 지수의 안정적인 지수 이관과 신규 책임투자형 지수의 안정적인 산 - 기업 개요 및 핵심역량 : 1) 기업 개요당사는 금융정보제공 및 금융관련 소프트웨어 개발을 주요 사업으로 하는 코스닥시장 상장기업(064850, KQ)으로 일반현황은 다음과 같습니다.회사명: ㈜에프앤가이드대표이사: 김군호, 이철순(각자대표)설립일: 2000년 7월 5일자본금: 60.4억원임직원수: 164명주요사업: 금융정보제공, 금융관련 소프트웨어개발, 펀드평가, 인덱스사업, 평가 및 컨설팅본사주소: 서울시 강서구 마곡중앙2로 61
2) 핵심역량국내 최고의 금융정보 서비스 업체로 장기 시계열의 외부 수신 데이터와 자체 생성 데이터를관리하면서 정합성을 확보하는 전문성과 노하우를 보유하고 있습니다. - 활용 사례 : 1) 지수 가공 서비스 상세 정보(사례)동사는 현재 각종 가공 지수 혹은 자체 지수를 매일 생성하여 서비스하고 있으며, 산출된 지수의 사례는 아래와 같습니다.
– 시장 지수: 대표적으로 MKF500이 있으며 업종 지수와 스타일/사이즈 지수를 산출하고 있음
– 테마지수: 특정 테마, 업종군, 그룹주 등이 포함되며 테마의 집중 정도에 따라 일반테마지수(ETF), 집중테마지수 (ETN) 및 그룹주 지수로 분류하여 서비스하고 있음.
– 금융스트레스지수: 금융시장의 변동성 부문, 변화율 부문, 스프레드 부문 등 3개 부문으로 구성하여 각 부문별로 선정한 Factor들에 대해 월별 데이터 기준으로 표준화 값(Z)을 산출함.
이 후 금융스트레스 참조지수를 기반으로 최적화된 Factor를 선정하여 등분산가중평균(Equal
-Variance Weighted Average) 비중(W)에 따라 최종 지수 값을 산출함.
주식회사해시스크래퍼 소개
- 주식회사해시스크래퍼은 2018-04-11에 설립되었습니다.
- 주소 : 서울 강서구 마곡중앙8로 14 601호(서울창업허브M+)
- 주요 서비스 : 주요서비스 상세정보해시스크래퍼가 제공하는 가공서비스는 크게 수집, 분석, 시각화 세 가지로 상세 내용은 아래와 같습니다.1.
데이터 수집 서비스해시스크래퍼의 매니지드 웹 크롤링 서비스(www.hashscraper.com)를 통해, 원하는 빅데이터를 신속하고 안정적으로, 합리적인 가격에 구축할 수 있습니다.
데이터 수집에 활용된 기술은 다음과 같습니다.
– Dynamic Web Scraping (동적 웹 스크래핑)플랫폼에서 제공하는 고수준 라이브러리(High
-level Library)를 활용하여 개발된 크롤러는 최신 기술이 반영된 웹사이트도 수집 가능
– Platform ‘AVALONE’ (데이터 수집 플랫폼 아발론)해시스크래퍼가 자체 개발한 데이터 수집 플랫폼으로, 개발자가 손쉽게 대용량 서버를 병렬사용할 수 있도록 지원하며, Fault Tolerance 기능이 포함되어 있어 오류가 발생하더라도 자 동으로 재시도하여 데이터를 안정적으로 수집할 수 있음또한, 개발자들에게 고수준의 라이브러리(High
-level Library)를 제공하여 새로운 웹사이트 를 수집할 경우 단 하루만에 개발할 수 있도록 지원함
– AI Parser (인공지능 파서)AI 기반 Parser 로 오류없이 정확하게 데이터를 추출하며, 유지보수를 최소화함
– Auto
-Scaling (서버의 확장 및 축소 기능)고도화된 클라우드 서버 운용 기술을 기반으로 수집된 데이터의 양에 맞추어 서버 용량을 확 장 및 축소함
– Scheduler (스케줄러)시간대별, 일별, 주별, 월별 등 최소 10분 단위까지 고객이 원하는 주기에 맞추어 데이터를 수 집함
– Hyper Proxy (하이퍼 프록시)자사 플랫폼은 멀티 클라우드를 활용가능한 구조로, 수 만개의 IP 주소를 확보할 수 있어 대부 분의 IP차단 솔루션을 회피하여 수집함
– Data Export (데이터 결과물 내보내기)고객 요구사항에 따라 Excel, JSON(API), DB 직접 연동 등 다양한 형태로 데이터 수집 결과 물을 제공
– API (Applicati - 보유 솔루션 : 1) 서비스 개요트렌드패드는 실시간으로 수집된 빅데이터를 분석하여 수치화하는 성과를 도출할 수 있는 SaaS 형태의 실시간 소셜 리스닝 서비스입니다.
고객이 직접 선정한 채널과 키워드에 해당하는 빅데이터를 실시간으로 수집하고 분석하여 다양한 시각화 자료로 구성합니다.
기존 고객사들은 트렌드패드를 글로벌 e
-커머스 분석과 VOC 및 리스크 관리로 활용하고 있습니다.
샘플은 트렌드패드(www.trendspad.net) 대시보드를 통해 확인가능합니다.
2) 핵심기능· 전수 데이터 수집고객이 아무리 많은 채널과 키워드를 선정하더라도, 고도화된 수집 및 클라우드 서버 운용 기술을 활용해 전수 데이터를 수집할 수 있습니다.· 실시간 댓글, 리뷰 수집데이터 수집 시 최소 1시간 단위의 짧은 주기로 수집하며, 실시간으로 업로드되는 댓글과 리뷰까지 수집할 수 있습니다.
이는 실시간 고객 반응 조사의 핵심으로, 이상감지 알고리즘과 함께 리스크 알림 기능을 제공합니다.· AI 딥러닝 기반 객관적 감성분석맞춤법 검사, 문장분리, 형태소 및 품사 기반 AI 문장분석을 통해 빅데이터를
-100~+100 사이 객관적인 긍정/부정 지표로 합니다.
고객반응조사 결과의 핵심 지표 중 하나입니다.· 언급량 및 감정흐름 기반 다양한 시각화 자료수집한 데이터를 분석하여 키워드별, 채널별, 기간별 언급량과 감정흐름을 바탕으로 리더보드, 4단계 감정분포, 워드클라우드, 워드카운트, VOC 리스트, 등의 다양한 인사이트를 확인할 수 있는 시각화 자료를 제공합니다.· 글로벌 채널 지원(15개국어)단어사전 기반 감성분석이 아닌 딥러닝 기반 분석 기술을 활용해, 15개국어를 번역하고 분석합니다.
이를 통해 각 언어별 전문가의 개입이 없어도 96.8%의 높은 정확도를 드러냅니다.
이를 바탕으로 Amazon(영국), Jingdong.com(중국), Citilink(러시아), Mercadolibre(멕시코) 등 다양한 언어의 글로벌 채널을 지원합니다.* 지원 언어: 한국어, 영어, 중국어(간체 및 번체), 일본어, - 품질 확보 전략 : 데이터 가공서비스 품질관리1.
사용자 기반 데이터 제공기본적으로 데이터의 품질의 향상하기 위해 본사의 서비스를 이용하는 사용자들이 원하는 기준에 맞는 데이터를 제공하여 품질개선 효과를 창출합니다.
개별 데이터 내 칼럼, 항목 뿐만 아니라 고객이 원하는 채널, 키워드를 설정하여 원하는 빅데이터를 빠르고 정확하게 구축할 수 있습니다.2.
정량적 품질 수준 측정 및 개선품질 수준을 정량화된 형태로 측정할 수 있는 데이터의 경우, 데이터 수집 또는 분석이 제대로 수행되지 않을 시 불일치, 누락 등의 형태로 분류하고 오류여부를 판단합니다.
이후 해결 방안 및 대안 제시를 통해 안정성을 확보하고 품질 개선을 달성하고 있습니다.3.
지속적인 R&D를 통한 품질관리데이터 분석의 경우 지속적인 연구 개발을 통해 알고리즘의 정확도를 향상하고, 학습하는 데이터의 품질도 개선하여 정확도 높은분석 결과가 나오도록 관리하고 있습니다.4.
데이터 품질 지표해시스크래퍼에서는 통상적으로 품질체계 수집을 위해 측정한 주요 6가지 품질지표를 적용하고 있습니다.
해당 지표는 아래와 같습니다.· 완전성(정보의 누락): 필수 속성은 반드시 데이터 값이 채워져 있어야 함· 유효성(형식, 산식 등의 규칙 오류): 데이터 값이 업무규칙을 준수하여 업무적으로 의미있는 값이어야 함· 유일성(동일 데이터 중복): 동일 데이터는 중복없이 하나로 관리되어야 함· 정합성(연관 정보의 일관성 오류): 상호 관련이 있는 테이블, 속성 간 데이터 값이 모순되지 않아야 함· 일치성(시스템 간 불일치): 정보 수신시스템은 연계받은 정보를 임의적으로 삭제, 수정 없이 활용해야 함· 적시성(정보 연계 지연): 정보 활용시스템에 업무적으로 적시에 제공되어 활용 가능하여야 함 - 유지보수 전략 : 데이터 가공서비스 유지보수 계획
1) 개요 및 목표데이터 가공 시스템 유지보수 사업 (SaaS형, 설치형)을 통해, 본사의 데이터 가공 서비스를 제공받은 수요기업이 안정적으로 서비스를 이용할 수 있도록 유지보수 제공을 목표로 합니다.
2) 유지보수 대상· 대상: 웹 빅데이터 수집 및 분석 서비스를 이용하는 수요기업· 상용 소프트웨어: Windows OS, RDBMS, MAC 외· 응용 소프트웨어: 자체 개발 소프트웨어3) 유지보수 범위· 지원 범위: IP 차단, 서버 사용비, 사이트 장애/업데이트 등등· 무상 유지보수
– SW제품에서 발생한 불량이나 오류 등 결함
– 기타 데이터 관련한 무상 유지보수· 유상 유지보수(별도 계약)
– SW 업데이트, 성능개선, 기능 추가 등의 라이센스 정책에 따른 최소한의 비용4) 유지보수 인력· 안정적인 시스템 운영을 위해 교육 및 훈련 등을 통해 고객 시스템이 자체 운영능력을 확보하여 시스템 장애 시 장애복구를 진행· 유지보수 조직 운영을 통해 경미한 장애의 경우, 신속한 복구 가능 (온라인 상)5) 유지보수 세부계획· 정기점검: 정기적으로 지원하는 정기점검 (매월)· 장애처리: 장애 요인별로 분석하여 장애처리 및 보고(A/S 보고서 작성)· 예방보수: 시스템 웹로그 분석 등으로 예상되는 예방보수 조치(예방 보고서 작성)· 전문인력지원: 서버 전문가에 의한 유지보수· 관리계획서 제출: 자체 시스템의 점검 및 조치, 사용자 계정 관리(대시보드)를 통한 계획서 작성 후 제출· 성능점검 및 분석: 일상적으로 Q&A 지원, 장애처리 및 요인별 문서화, 정기점검, 성능 최적화 서비스· 상태보고 및 업무매뉴얼: 정기, 수시적으로 유지보수 작업보고서 작성, 장애초지 상세내역 작성(업무 매뉴얼에 따른 절차 설명)· 사업관리: 전반적인 서버, DB, 네트워크 등에 대한 서비스 사업 관리· 기타 지원: 기본관리, 구성관리, 성능관리, 보안관리, 자산관리, 백업관리 등2.
고객관리 및 응대
1) 고객관리자체 제작 콘텐츠를 포함한 정기, 수시 뉴스레 - 카테고리 구분 : 전처리,시각화,분석
- 실적 : 최근 3년 유사사업 참여 내용해시스크래퍼는 2018년 4월 설립 이후 데이터 수집·분석 분야에서 활동하며 2021년에는 시각화 서비스까지 서비스를 확장하였으며, 2022년 2월 현재 500여 개 이상의 고객사들과 함께하고 있습니다.
특히, 2021년, 2022년도 2년 연속 데이터바우처 지원사업에서 공급기업으로 선정되어 안정적으로 데이터 가공 서비스를 제공한 바 있습니다.
최근 3년 유사사업 참여 주요 내용은 아래와 같습니다.데이터 수집·분석·시각화· (데이터바우처 공급) 기업의 요청에 따른 자사제품 및 타사제품 데이터 수집· (데이터바우처 공급) 기업의 원천 데이터 제공 하에, AI 가공을 거쳐 유사판단 서비스 제공· 기업의 요청에 따른 비교데이터 정보 제공· 기업이 지정한 수집 키워드에 대해 데이터 북 형태로 제공· 시스템 구축과 함께 기업이 요청한 사이트에서의 데이터 수집 및 시각화, 리뷰 감정분석 등의 분석 - 기업 개요 및 핵심역량 : 기업개요 및 핵심역량1.
기업 개요
1) 해시스크래퍼는 2018년 4월 설립된, 빅데이터 수집·분석, 인공지능 연구개발 전문기업입니다.
데이터 수집·분석, 인공지능, 머신러닝 분야에서 20년 이상의 경력을 지닌 전문 인력들이 함께하며, 기업부설연구소를 중심으로 클라우드 서버 운영·자연어 처리·머신러닝 알고리즘 고도화 관련 연구개발을 진행하고 있습니다.
2) 해시스크래퍼는 “Let Data Talk, Let Data Valuable.” 이라는 비전 아래, 빅데이터의 상용화와 동시에 데이터로 소통하는 세상을 만들어나가고자 합니다.
23년 1월 기준 해시스크래퍼는 빅데이터 수집·분석 솔루션 “매니지드 웹 크롤링”과 실시간 트렌드 인공지능 분석·시각화 “트렌드패드” 두 서비스를 운영하며 국내 데이터 산업 생태계 활성화에 지속적으로 기여하고 있습니다.2.
기업 연혁주요연혁2023.01.데이터바우처 공급기업 선정(판매, 가공)2022.10.
하이서울기업 인증 선정(서울산업진흥원)2022.08.
EU/미국 특허출원 “동일구조의 데이터를 추출하는 방법 및 그를 이용한 장치“2022.03.
SW고성장클럽 대상기업 선정2022.01.
글로벌 API 마켓플레이스 대표기업(네이버 클라우드)2022.01.
데이터바우처 공급기업 선정2021.09.
글로벌 소셜 리스닝 “트렌드패드” 론칭2021.02.
데이터바우처 공급기업 선정2020.09.
한국벤처투자 투자유치2020.04.
기업부설연구소 설립2020.03.
청년창업사관학교 10기 선정2019.01.
특허등록 “하이브리드 크롤링을 통해 데이터를 수집하는 방법”2018.04.
빅데이터 수집·분석 서비스 “매니지드 웹 크롤링” 론칭2018.04.
주식회사 해시스크래퍼 설립3.
현황(23년 1월 기준)· 고객사 수: 500+· 보유 데이터셋: 4.5억 건 이상· 일일 최대 수집가능 데이터 수: 최대 1억건 이상· 운용 서버 수: 150대 이상· Proxy 서버 수: 20대 이상4.
주요 사업 및 서비스
1) 사업 영역해시스크래퍼는 AI 기술 기 - 활용 사례 : 1.
고객 레퍼런스2023년 1월 현재 500여 개 이상의 고객사가 해시스크래퍼의 서비스를 이용하였습니다.
서비스별 주요 활용사례는 아래와 같습니다.
1) 매니지드 웹 크롤링서비스 출시 이후 버드뷰(화해), 한국방송공사, 아모레퍼시픽, 삼성디스플레이, LG전자, 동화기업, 줌인터넷, MK TV(김미경 TV) 등 다양한 분야의 고객사에서 소셜 데이터 수집 및 분석으로 활용하였습니다.
특히, 2021년에는 데이터바우처 공급기업으로 동화기업, 기율특허법률사무소 등 , 2022년도에는 콘텐츠홀딩스에 안정적인 데이터 가공서비스를 제공한바 있있습니다.
.
아래는 매니지드 웹 크롤링 이용 고객 대표사례입니다.고객사내용버드뷰(화해)인스타그램 유저 및 게시글 정보 수집, 월 120만 건, 일 1회 6,000건 수집·분석한국방송공사(KBS)4,000여개 여론 기사 수집·분석, 언론사 평가 TV프로그램(저널리즘J) 근거 자료로 활용아모레퍼시픽독일, 중국 쇼핑몰 내 판매상품 데이터 수집·분석, 800만 건 데이터 수집 후 키워드 빈도, 형태소, 이미지 분석 및 자연어 처리 수행삼성디스플레이국내외 SNS 등 다양한 채널에서 제품 출시 전후 고객 반응을 수집·분석, 구매 인사이트 도출 후 판매예측모델 구축의 근거로 활용한국문학번역원주요 국가의 한국 문학에 대한 반응을 분석하고자 SNS, 언론기사에서 반응도 수집·분석인사이트코리아SNS에서 대량의 데이터를 빠르게 수집하고 정제·가공, 머신러닝 기반의 자연어처리 분석 테스트.
감정분석 기술 적용.LG전자트위터에서 제품 관련 고객반응 수집.
트윗 및 팔로워 수집을 통한 데이터 정보 획득줌인터넷다양한 뉴스 기사 수집 이메일링 서비스 제공.
원하는 키워드에 맞게 기사 수 분배하여 데이터 수집 개발동화기업국내 SNS 채널 내 제품 관련 소비자 반응 수집·분석, 구매 인사이트 도출 후 판매예측모델 근거로 활용.
데이터에 대한 인사이트 및 레포트 제공옐로모바일SNS 마케팅 결과 수집·분석.
신규 게시글 및 댓글 수집·분석, 시각변수와 시각화 및 분석
주식회사 햄프킹 소개
- 주식회사 햄프킹은 2020-02-28에 설립되었습니다.
- 주소 : 서울 강서구 마곡중앙8로 14 513호
- 주요 서비스 : 1.
IDP(Intelligent Document Processer)활용 데이터 분류 및 시각화 서비스기존 고객별로 수기로 받던 자료들을 이미지 인식을 통해서 자동분류 자동 분류된 정보를 엑셀에 자동입력하여 데이터화데이터화가 끝난 이후 입력된 정보를 바탕으로 데이터 시각화 기능2, 웹스크래이핑 활용 알림 자동화 서비스자동분류된 데이터를 카카오톡으로 발송3.
RPA 활용 업무 자동화 서비스단순 반복업무 자동화EX) 택배 송장 입력, 재고 입력 - 보유 솔루션 : HempkingIDP(Intelligent Document Processer) 솔루션딥러닝 활용한 이미지 패턴 분석 및 텍스트 마이닝 기술을 바탕으로문서(인보이스, 공문서 등)에서 필요데이터 추출하는 프로그램 입니다.Hempking RPA 솔루션사람이 하는 반복적이고, 규칙에 기반한 일을 자동화하는SW Robot 프로그램 입니다.
클라우드VDI기반 RPA 활용 세무업무 자동화 프로그램Hyper
-V 기반 가상 데스크톱 인프라에서 서비스 입니다.사용자는 별도의 장비 구매 없이 서비스 구매만으로 RPA 사용 가능합니다.부가가치세 조회, 사업자등록증 조회, 매출집계 등세무법인에서 공통적으로 자주 발생하는 업무 10여개에대한 자동화 기본 제공합니다. - 품질 확보 전략 : 당사에서 보유한 성과지표는 아래와 같습니다.
No구분핵심지표 (KPI)단위현재 목표가중치비 고1생산성 및 품질 개선 성과프로그램 구동시간대비특정 업무 단축시간Hr구동 주0시간구동 주45시간0.4 2업무별 효율성 증가(시간)%100%120%0.1 3경영개선 성과데이터 분류 및 활용개별업체데이터 개별금액산정0.2상의4매출 증가 (분기 당기순익 기준)%100120%0.3 합 계 1 또한 수요기업별로 데이터 활용방안에 맞춰 별도로 측정할 예정입니다.현재 햄프킹 RPA 및 햄프킹 IDP는 G/S 인증 1등급 심사을 진행중에 있으며 특허 출원 진행중입니다. - 유지보수 전략 : 개요원천 시스템의 화면을 제어하여 동작하는 RPA의 특성상 지속적인 유지보수가 필요함.
유지보수 대상유지보수 지원 대상상용 소프트웨어 : Hempking RPA, Hempking IDP응용 소프트웨어 : 수요기업별Hempking RPA로 작성된자동화 시나리오 유지보수 범위
-해당 사업을 통하여 구축한 클라우드 인프라의 상시 모니터링 및 운영.
공급기업의Hempking RPA및RPA 자동화 시나리오의 에러 조치 및 구축 범위내 정상 실행을 위해 지속적인 유지보수
-해당 사업의 범위를 벗어나지만 클라우드 RPA를 활용한 업무 자동화 추가할 경우 별도 계약으로유상유지보수무상 유지보수 (하자보수)유상 유지보수 (별도계약) Hempking RPA 솔루션 운영 및 업그레이드RPA 자동화 시나리오 운영 및 에러 조치 Hempking RPA 솔루션 추가(추가분)신규 RPA 자동화 시나리오 추가 유지보수 조직 및 인력
-교육훈련 등을 통해 고객이 RPA 자동화 프로그램에 숙달되어 자체 운영능력을 확보하여 시스템 장애시 1차적인 장애복구를 진행.
상시 문의응대 체계 구축을 통해 2차적인 장애 복구를 진행
-이와 같이 2단계의 유지보수 조직 운영을 통해 경미한 장애의 경우 신속한 복구 가능
□ 유지보수 세부사항구 분세 부 사 항정기점검월 1회수시점검상시 모니터링 및 문의 응대 성능점검 및 분석구축 종료시점 성능점검 기준 FIX 후 반기마다 성능점검 및 분석관리계획서 제출구축 종료시점 관리 계획서 제출 후 반기마다 관리계획서 항목 검수상태보고및 업무매뉴얼구축 종료시점 상태보고 및 업무매뉴얼 제출사업관리반기마다 사업관리 항목 검수기타 지원· Hempking RPA 솔루션 업그레이드 버전 제공 - 카테고리 구분 : 전처리,코딩,시각화,정보추출또는조합,분석
- 실적 : 순번고객제품(서비스)진입 시기(기간)1대기업 물류 L사햄프킹 RPA햄프킹IDP2020.05 ~2대형 H관세법인햄프킹RPA햄프킹IDP2020.10 ~3대기업 식품 O사햄프킹RPA햄프킹IDP2021.10 ~4통신 L사햄프킹RPA2021.11 ~ 5정부 P기관햄프킹IDP2021.12 ~6대기업 L사햄프킹RPA2022.02 ~
- 기업 개요 및 핵심역량 : 주식회사 햄프킹은 RPA 솔루션 및 IDP(Intelligent Document Processer) 솔루션을개발/판매하고 있습니다.
또한 이를 바탕으로 서비스를 제공하며 사무 업무에서 발생하는 수작업의자동화를 달성하고 궁극적으로 수요기업의 생산성 향상에 이바지 하고자 합니다.자사는 자동화에 관련한 다양한솔루션 및 코어 엔진을 보유하여타사의 자동화 솔루션 라이센스를 가져와 서비스만 제공하는 기존 SI업체와 다르게차별화된 고품질의 산출물을 제공하며 이미지 분석, 문서 자동화, 유입정보 분석,웹 기반 페이지 크롤링 등의 Total 서비스를 수요기업에 제공합니다. - 활용 사례 : 1.
물류 서류 입력 자동화기존업무방법①매일 발생하는 선화증권(B/L) 및선박회사의 운임 인보이스를 각 선박회사의 홈페이지에 접속하여 다운로드②다운받은 PDF형태의선화증권 및 선박회사의 인보이스에서 필요데이터를 사람이 보고 ERP 에등록자동화 적용 모습선박회사의홈페이지에 접속하여 일별 데이터 자동 다운로드하고다운로드한PDF에서필요데이터 자동 추출하여 ERP에자동 입력2.
대형 관세법인 통관 서류 입력 자동화기존업무방법①실시간으로 발생하는 고객의 통관 소요에 맞춰 선화증권(B/L) 및고객사의 수입 품목 인보이스를 수취②수취한 통관 서류를 사람이 보고 입력 항목 식별 후 관세청 UNIPASS에수기로 등록자동화 적용 모습고객에게수취한 서류 자동분류 및 필요 정보 자동 추출 후 UNIPASS에자동 입력3.
대기업 식품 O사 서류입력 자동화기존업무방법①해외 협력사에서 들어오는 선화증권(B/L),패킹리스트(P/L),품목인보이스의 정보를 ERP에정리②전달받은 서류에서 사람이 보고 데이터 식별 후 전사에서사용하는 SAPERP 에데이터 수기로 업로드자동화 적용 모습해외협력사에서 들어오는 물류 서류 자동 분류 후 입력 필요 데이터 자동 추출하여SAP 에자동 입력4.
P기관 신원조사 업무서류 확인 자동화기존업무방법①의뢰기관의 요청을 받아 신원조사 대상자가 제출한 서류를바탕으로 1차신원 조사②조사 대상자가 제출한 서류의 정합성 및 사용자 기입 항목기본 서류와 일치여부 판단 후 1차신원 조사 완료자동화 적용 모습신원조사 대상자 제출서류와 사용자 기입항목 정합성 자동 판단 후판별완료데이터 신원 조사 시스템으로 자동 전송

데이터바우처 사업관리 가공기업 정보

한국데이터산업진흥원 데이터바우처 사업을 통해 지정된 공급기업 중 데이터 가공기업 정보를 제공하고 있습니다. 본 데이터는 데이터바우처 지원사업에 참여하는 기업들의 정보를 포괄적으로 다룹니다. 특히, 수요기업이 필요로 하는 다양한 형태의 데이터 가공 서비스에 대한 정보를 제공함으로써, 데이터 활용의 범위를 넓히고, 기업의 데이터 기반 의사결정을 지원하는 역할을 합니다. 이 데이터가 보유한 컬럼은 다음과 같습니다.
기업한글명(문자형) : 해당 기업의 한글 이름
설립일자(날짜형) : 기업이 설립된 날짜
기본주소(문자형) : 기업의 본사 주소
상세주소(문자형) : 기업의 주소에 대한 추가 정보
주요서비스 상세정보(문자형) : 데이터 가공기업이 제공하는 구체적인 서비스 내용
보유솔루션(문자형) : 기업이 보유한 해결책 및 시스템에 관한 상세 정보
품질확보전략(문자형) : 데이터 품질 확보를 위한 기업의 전략
유지보수전략(문자형) : 데이터 가공 서비스 후속 지원 계획
카테고리구분(문자형) : 제공하는 데이터 가공 서비스의 카테고리 분류
등록일(날짜형) : 데이터가 등록된 날짜
실적(문자형) : 기업의 성과와 실적
기업개요 및 핵심역량(문자형) : 기업의 전반적인 설명과 주요 전문성
활용사례(문자형) : 데이터 및 서비스를 활용한 실제 사례
링크(URL) : 데이터에 대한 추가 정보 및 접근 링크
파일 다운받기
주요서비스 상세정보(요약), 보유솔루션(요약), 품질확보전략(요약), 유지보수(후속지원), 전략(요약), 실적(요약) 등의 일부 데이터 값은 데이터 미집계로 인해 공란이 있습니다.