07/27/2024
AIの知識の源は主としてインターネット上のデータです。インターネットは毎日新しい情報がいっぱい増えていますが、それでもAIは既に過去のデータに加え、新しいデータも食べ尽くしてしまってる、ということをご存知ですか? そこでSynthetic Data(人工データ)というのが登場します。AIが人工的にデータを作って、AIの情報源を生成してるんです。
当然、人間の手が入らないので、情報はだんだんと変になっていきます。それを治す、というか人間が理解できて役にたつデータにするための技術が必要になってきてます。これを、データ拡張技術(Data Augementation)と呼びます。とは言っても、大量のデータの修正を人間がマニュアルに作業できる様な量じゃ無いので、これもAIにやらせます。ただし人間がちゃんと監修する、という機能が加わる事によって質の良いデータをキュレートする、という考え方です。
、、、という記事をAIに書かせました。
参考文献は、27個、1万文字以上の記事、あっという間に作ってしまう、というのはすごい事ですが、これでもAIの黎明期、という事ですから、これから時代はどう進化していくのか、非常に興味あります。
概要 人工知能(AI)におけるデータ拡張技術は、既存のデータセットから新しいデータを人工的に生成する技術を指し、これによりAIモデルの性能と堅牢性を向上させます。追加のデータ収集を必要とせずにトレーニングデ....