エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
Gemini API + Vision APIを試してみた(名刺データの整形) こんにちは、京セラコミュニケーションシス... Gemini API + Vision APIを試してみた(名刺データの整形) こんにちは、京セラコミュニケーションシステム 立脇(@kccs_hiroshi-tatsuwaki)です。 Qiitaを眺めていたら、タイムラインでこんな記事を発見! タイトルが斬新だったので「何だこの記事は!」と思って閲覧させていただきました。 内容を読むと、なるほど。Cloud Vision API + GPT4 APIですか。おもしろいアプローチですね!(AI OCRを挟むのがミソなわけですね。) そして、この記事を読んだときに、ふと「そういえばGeminiって今どうなってるんだっけ?」とも思いました。 ということで、記事を参考にさせてもらいながら名刺をOCRしつつ、Geminiも試してみたいと思います。 今回試す構成図は以下の通りです。 この記事を読んでわかること 2024年4月時点のCloud Vis