【新華社北京4月1日】中国国家データ局はこのほど、四川省成都と遼寧省瀋陽、安徽省合肥、湖南省長沙、海南省海口、河北省保定、山西省大同の7都市にあるデータアノテーション拠点について、作業実績が1万7282テラバイト(TB)と再び過去最高を記録したと明らかにした。
データアノテーションはデータにタグや説明、解釈、分類を付加する作業であり、人工知能(AI)アルゴリズムやAIモデルのコア能力を高める重要なプロセスとなっている。国内に7カ所あるデータアノテーション拠点はすでに医療、工業、教育などの業界の質の高いデータセットを335形成しており、121の国産大型AIモデルの研究・開発を支援している。アノテーションを行う企業を223社誘致・育成し、従業員数は5万8千人に上り、データアノテーションの生産額は83億元(1元=約21円)を超えた。
同局の担当者によると、今後はデータの採集、アノテーション、AI応用産業チェーンの円滑化を図り、工業、金融、医療、交通、教育などいくつかの分野で質の高いデータセットの形成を重点的に推進し、データアノテーション産業の質の高い発展を促していく。