현재 국내 데이터 라벨 시장의 규모는 얼마나 됩니까?
헤드 기업은 자체 구축 데이터 팀으로 중소 규모의 데이터 공급업체가 상당 부분을 차지하고 있습니다.
현재 중국 국내 데이터 표기 시장 1 단계 팀에는 헤드회사가 자체 데이터 표기 부서를 설립하고 있으며, JD.COM(JD.COM 중지), 바이두 (바이두 중책), 텐센트, 알리 (알리 데이터 표시) 는 모두 자체 표기 플랫폼과 도구를 갖추고 있다. 헤드 회사 외에도 최근 몇 년 동안 국내에도 용고양이 데이터, 테스틴 클라우드 테스트, Besay BasicFinder, Data Hall 등과 같은 많은 데이터 레이블 회사가 출현했다. 이 회사들은 머리 회사에 이어 두 번째로 상당한 규모를 가지고 있으며, 두 번째 계단에 위치해 있다.
중국 데이터 레이블 업계의 참가자 중 규모에 따라 브랜드 데이터 서비스 업체, 중소형 데이터 공급업체 및 수요자 자체 구축 기본 데이터 팀이 시장 경쟁 관계를 형성하고 있으며, AI 데이터 레이블 시장의 주요 공급업체로 20 19 년 비율은 각각 30.4%, 47.0%, 22.6% 입니다. 현재 중소 규모 데이터 공급업체는 시장의 주요 공급업체입니다.
모델에 따라 데이터 레이블 회사와 크라우드 소싱 플랫폼으로 나뉘며 서비스 범위가 광범위합니다.
참여 방식에 따라 중국 데이터 레이블 업계의 참여 기업은 주로 크라우드 플랫폼과 자체 제작 공장 (전문 데이터 레이블 회사) 으로 나뉜다. 2020 년 데이터 레이블 회사 순위에서 Testin 클라우드 테스트, 데이터당, 용고양이 데이터가 상위 3 위 안에 들었습니다. 데이터 라벨 크라우드 플랫폼 순위에서 JD.COM 은 대중의 지혜, 바이두 중책, 데이터당이 상위 3 위를 차지했다.
데이터 표시 대표 기업의 업무 레이아웃을 보면 대부분의 데이터 표시 서비스 업체는 텍스트, 음성, 이미지, 비디오 등 다양한 유형의 데이터 표시를 제공합니다. 서비스 애플리케이션 분야는 보안, 스마트 운전, 의료, 교육, 금융 등 여러 분야를 포괄합니다. 주요 고객으로는 기술 회사, 인공지능 기업, 전통 기업, 정부 부문, 과학기관 등이 있습니다.
시각 업무를 위주로 하는 기업은 대부분 자체 스티커 기지를 건설하여 산서허난 등지에 많이 분포한다.
AI 데이터에 따르면 비즈니스 방향과 시장 진입 시간에 따라 업계 내 플레이어는 초기 플레이어, 중기 후기 플레이어, 시각 서비스에 집중하는 플레이어, 음성 서비스에 집중하는 플레이어로 크게 나눌 수 있다. 그 중에서도 음성 데이터에 더 집중하는 플레이어는 대개 자신의 지적 재산권이 더 많은 데이터 세트를 가지고 있다. (윌리엄 셰익스피어, 윈스턴, 음성, 음성, 음성, 음성, 음성, 음성, 음성) 자체 스티커 기지나 풀 타임 스티커 팀이 있는 사람은 대부분 비주얼 게이머입니다.
인공지능 산업 사슬에서 없어서는 안 될 일환으로, AI 데이터 마크업 서비스의 발전은 이미 각지에서 AI 건설을 추진하는 중요한 방향 중 하나가 되었다. 구이저우 (), 산시 (), 충칭 () 등지에서 지도의견을 잇달아 내놓고, 과학기술회사를 도입하고, 데이터 기지와 데이터 거래센터를 건설하며, 지방적 특색을 지닌 인공지능 산업원을 건설하였다.
현재, 많은 데이터 표시 회사는 Baidu 의 Shanxi AI 데이터 표시 기지, Baidu Data Baizhihe 기지, 데이터 홀 보정 데이터 처리 기지, 데이터 홀 허페이 데이터 기지, 데이터 홀 베이징 TTS 녹음 센터 등 자체 구축 마크업 기지 또는 팀을 보유하고 있으며, 대부분 Shanxi, Henan 및 기타 지역에 위치하고 있습니다.
베이징, 상하이, 청두는 수요기업 상위 3 위이며 항주의 수가 다소 감소했다.
수요기업의 경우 AI 데이터 표기 통계에 따르면 2020 년 4 월 국내 데이터 표기업체 수는 565 개, 2020 년 2 월, 수는 705 개로 늘었다. 데이터 표시 기업의 지역 분포로 볼 때 2020 년 말 현재 65438+2 월 베이징 상하이 청두 선전 항주는 TOP5 도시로 각각 185, 84, 68, 63 에 달했다. 이 가운데 베이징 상하이 청두 선전 기업 수는 2020 년 4 월보다 모두 증가했고 항주 기업 수는 2020 년 4 월보다 감소했다.
시장 집중도가 낮고, 미래가 개선될 것이며, 업계 인수합병이 추세가 될 것이다.
20 19 년 AI 데이터 레이블 업계 CR5 (상위 5 대 기업 시장 점유율) 는 26.2% 로 집중도가 낮은 경쟁 단계에 있으며, 업계는 활력이 넘치고 발전공간이 좋다. 5 대 기업 중 해천일성과 바이두 데이터 중갑이 갈수록 인기를 끌고 있다. 국내 전체 공급업체 중 상당수가 인물 데이터, OCR 데이터, 자동 운전 데이터 등을 포함한 이미지 데이터 샘플링 서비스를 제공하는 것으로 알려졌다. 업무 수요가 분산되어 있는데, 그중에서도 바이두 데이터 크라우드 수입이 가장 큰 비중을 차지한다.
대조적으로 음성 데이터의 수요는 상대적으로 집중되고 공급 문턱은 이미지 데이터보다 높다. 내용에는 음성 인식 데이터, 음성 합성 데이터 등이 포함됩니다. 이 가운데 해천성서의 소득 점유율이 가장 크다.
현재 인공지능 데이터 라벨 업계의 집중도가 적당하여 과점 시장도 아니고 충분한 경쟁 시장도 아니다. 한편 바이두 데이터 크라우드, 해천성서, 데이터당 등 기업들이 시장에 일찍 진출해 더 많은 고객 자원을 축적했다. 한편 하류 기업들이 이전에 공공 데이터 세트 훈련 모델을 사용했기 때문에 데이터 정밀도에 대한 요구는 여전히 짧으며 생태 전도 효과의 지연성으로 인해 시장 문턱이 뚜렷하지 않다. 자본과 R&D 실력이 약한 중소기업은 여전히 비교적 강한 발전 토양을 가지고 있다.
그러나 향후 다운스트림 기업이 발전함에 따라 아웃소싱 팀을 직접 사용하는 데 드는 비용이 저렴하고 데이터 보안 및 제어 기능이 강화될 것입니다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 성공명언) 일부 기본 수요는 하류 기업에 의해 자급자족될 것이며, 외부 데이터 서비스 공급업체의 기존 재고 시장은 하락에 직면할 것이므로, 고도의 난이도, 최전방의 독특한 임무를 수행해야 합니다. 이를 위해서는 고도의 정밀도, 전문 데이터 처리 도구의 연구 개발 및 인공 지능 알고리즘에 대한 기초 연구를 실시하여 고객 수요를 파악하고 증분 시장을 개척해야 합니다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), 예술명언) 따라서 자본과 R&D 실력은 이미 높은 업계의 문턱이 되었다. 동시에, 최근 몇 년 동안 자본 시장의 냉각으로 인해 중소 업체들은 업무 수축에 직면해 있다. 게다가, 일부 제조사들은 이미 업계 내에서 인수를 시작했다. 해외 데이터 서비스 시장의 발전 (해외 업계의 거물인 아펑이 여러 차례 다른 회사를 인수함) 을 참고하면 인수합병도 시장 추세가 될 것이며, 여러 요인의 영향으로 산업 집중도가 높아질 것이다.
요약하자면, 데이터 레이블 업계의 합병은 미래의 대세 추세가 될 것이다. 현재 국내의 전형적인 M&A 사건은 Bisai BasicFinder 가 전문 인공표기 서비스 공급업체를 인수하여 독립 데이터 수집 시스템을 풍부하게 하고 다양한 임무를 완수하는 것이다. 글로벌 데이터 라벨 산업의 합병 및 구조 조정 속도가 빨라졌습니다.
한편, 헤드 기업들은 점차 중소 마이크로데이터 플랫폼을 인수하여 협상 능력을 새로운 차원으로 끌어올렸다. 이러한 맥락에서 글로벌 데이터 레이블 업계의 시장 집중도가 더욱 높아지고 있습니다. 데이터 레이블 업계의 인수 규모는 계속 증가할 것이며 업계 경쟁은 더욱 치열해질 것입니다.
더 많은 자료는 전향산업연구원' 중국 데이터 라벨 업계 시장 전망 및 투자 전략 계획 분석 보고서' 를 참조하십시오.