株式会社エンジョイ

株式会社エンジョイ こんにちは!(株)エンジョイです。
世の中をITでもっと面白く!タノシ? <事業内容>
システムインテグレーション
経営コンサルティングサービス
常駐型プロジェクト支援
美容事業

イノベーション事業部の茶々丸です。「Googleレンズ」にまたもや新しい機能が加わりました。Google LLCの今のトレンドなのかどんどん色んな機能が追加されていきますね。それでは紹介していきましょう。・動画理解機能Google 検索アプ...
15/10/2024

イノベーション事業部の茶々丸です。
「Googleレンズ」にまたもや新しい機能が加わりました。Google LLCの今のトレンドなのかどんどん色んな機能が追加されていきますね。それでは紹介していきましょう。

・動画理解機能
Google 検索アプリ内でレンズを開き、シャッターボタンを長押しして動画を撮影しながら音声による質問が可能になりました。また動画だけならず、写真を撮る際にも同様に音声による質問が可能なようです。

どちらの機能も現状では英語による音声にしか対応していませんが、当ブログでも度々紹介しているGoogleの生成AIモデル「Gemini(ジェミニ)」が動画と質問を解析し、回答を生成するようです。

Googleのエンジニアリング担当バイスプレジデントであるRajan Patel氏曰く「動画を一連の画像フレームとしてキャプチャし、それをカスタムGeminiモデルに渡しています。そうすることで、AIが複数のフレームを連続的に理解し、ウェブに基づいた回答を生成します」といった説明をされているようです。

今はまだ携帯端末という形での小型のサポート端末という存在ではありますが、いよいよもって動画というリアルタイムの処理にも対応するようになってきたこともあって、色々なSF作品に出てくるような人間とほぼ見た目の変わらない人型アンドロイドや現代日本でも最も身近な青色のネコ型ロボットなど、夢にまで見た存在が現実味を帯びてきたように感じられます。

青色のネコ型ロボットは22世紀(西暦2101年~2200年)の未来からやってきているわけですが、このまま技術が進歩していけばもっと近い将来になりそうですね。

Googleだけでなく、色々な企業がAI技術に日夜従事する現代社会、さらなる革命的な一石を投じるのは誰になるのか、今後も注目ですね。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

システム開発部の月月です。今回は「Project Astra」についてご紹介していきます。Project Astraとは常在型のAIとしてカメラの映像をスキャンして常に周囲の状況を理解する技術です。スマートフォンやスマートグラスのカメラを通...
16/09/2024

システム開発部の月月です。
今回は「Project Astra」についてご紹介していきます。

Project Astraとは常在型のAIとしてカメラの映像をスキャンして常に周囲の状況を理解する技術です。
スマートフォンやスマートグラスのカメラを通じて見える物体やシーンを理解し、音声コマンドにより会話できるAIアシスタントとして活用されます。

Project Astraは、窓から見える景色を解析して現在の居場所を理解したり、視界に入っている物の名前や用途を教えてくれたり、PC画面上で作成中のコードを読み取って分析してくれたりといった高度な認識能力を持っています。

ユーザーが見聞きする世界をProject Astraと共有して、その情報をAIの力で分析してもらうことで人々の思考や行動を助けてもらうイメージでしょうか。

活用例としては、自分ではどこに置いたか分からなくなってしまった物の場所を思い出させてくれたり、日常やビジネスにおけるタスク管理を助けてくれたり、その他にも多岐にわたるシーンでの活躍が期待されます。

今はまだ普及度の高くないスマートグラスのようなウェアラブルデバイスが今よりもっと普及した時にこそ、Project Astraは強力なアシスタントとして人々の助けになることでしょう。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

イノベーション事業部の茶々丸です。当ブログにて昨年度からもちょくちょく話題となっている「Googleレンズ」について、またも新たな機能が追加されるようで今回の第51回でも紹介させて頂きます。「Googleレンズ」はこの度デスクトップ版Chr...
15/08/2024

イノベーション事業部の茶々丸です。
当ブログにて昨年度からもちょくちょく話題となっている「Googleレンズ」について、またも新たな機能が追加されるようで今回の第51回でも紹介させて頂きます。

「Googleレンズ」はこの度デスクトップ版Chromeでも、モバイル版のようにウェブの画像などを検索できるようになるようです。
以前第45回などで紹介させて頂いた「かこって検索」がデスクトップ版Chromeでも出来るようになったといった具合のようです。

・機能詳細
ブラウザ上のアドレスバー部分にGoogleレンズアイコンが新たに追加されるようでそちらを押下すると、Googleレンズで検索する範囲を選択できる状態となります(スクリーンショットを取る際に指定した一部範囲を切り取るのと同じような感覚ですね)
この状態で、表示されているブラウザ上にある画像、たとえば猫の画像を範囲として選択することで、ブラウザ右部にGoogleレンズでの検索結果が表示されます。
現状まだアドレスバー部分にデフォルトでGoogleレンズアイコンは追加されていませんが、ブラウザ上で右クリック➡Googleで画像を検索からでも同様の機能を使用できます。

またこちらも今後追加される機能のようですが、上記のように手動でブラウザ上の画像の一部を切り取って検索するのではなく、画像の中のたとえばカバンを押下するだけで自動的にカバンに関わる部分が選択されGoogleレンズでの検索結果が表示されるといった便利な機能もあるようです。

さらにさらに、表示されたGoogleレンズでの検索結果にマルチ検索機能を使って検索を絞り込んだり、追加の質問をすることも可能で、質問の内容によっては、AIによる概要が表示される機能も実装されるようです。

ますます便利になっていく検索機能に今後も目が離せませんね。
私的には迷子の猫などの画像を基に、SNSの画像付きの投稿や街中の監視カメラの映像から、リアルタイムに移動経路を辿り早期発見に繋がるようなシステムが「Googleレンズ」に搭載されているAIを用いて開発されたりすることを願ってしまいます。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

システム開発部の月月です。エンジニアブログ第50回を迎える今回はGoogleのAI開発組織「Google DeepMind」が発表した、動画に合わせてオーディオ生成が可能な「V2A」についてご紹介します。昨今は動画を作成できる生成AIの開発...
15/07/2024

システム開発部の月月です。

エンジニアブログ第50回を迎える今回はGoogleのAI開発組織「Google DeepMind」が発表した、
動画に合わせてオーディオ生成が可能な「V2A」についてご紹介します。

昨今は動画を作成できる生成AIの開発に様々な企業が取り組み研究を推し進めています。
ところが、現時点ではそれらによって生成された動画はほぼ無音のものばかりです。

「V2A」は生成AIによって作られた動画や無音の動画に合わせてBGMやリアルな効果音、キャラクターのセリフなどを生成する技術です。

例えばギターを演奏している動画を生成AIに作成させた場合、
従来は無音の動画が生成されるのみでした。

「V2A」に生成AIが作った無音のギター演奏動画と「ライブステージでソロパートを演奏するギタリスト」のようなテキストプロンプトを与えることで、
映像とプロンプトからイメージされる楽器の演奏音が生成されます。

また、昔のモノクロ無音映画に対して今回紹介した「V2A」や他の生成AIを利用することで、
シーンに合った音声を生成したり映像に自然な着色を行ったりといったことも可能となりました。

革新的な技術に思える「V2A」技術ですが、
高品質な音声を生成するためには高品質な映像を入力する必要があったり、
人間が喋っている映像に合わせてテキストを音声変換させる「リップシンク」もまだ改善すべき点が多かったりと
まだまだ解決すべき問題を抱えているとのことです。

テキストやソースコードのみならず、イラストや動画、音声に至るまで、
生成AIの携わる領域が飛躍的に拡張されてきていますね。
幅広いプロダクトにAI技術が活発に活用されるような未来もそう遠くない気配がします。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

イノベーション事業部の茶々丸です。第49回では先月5月中旬にGoogleが発表したAIを活用した検索機能「AI Overview」について紹介します。こちらの機能は昨年にGoogleが新しい機能として試験提供していたSGE(Search G...
14/06/2024

イノベーション事業部の茶々丸です。

第49回では先月5月中旬にGoogleが発表したAIを活用した検索機能「AI Overview」について紹介します。

こちらの機能は昨年にGoogleが新しい機能として試験提供していたSGE(Search Generative Experience)という機能の正式版にあたります。

「AI Overview」は通常のGoogle検索結果にさらにプラスして、検索結果上にAIによる回答を表示する機能となります。
現在は米国のみで提供されている機能のため日本での提供開始時期はまだ明らかになってはいませんが、近い将来提供されることでしょう。

しかしこの「AI Overview」現状まだ問題となっている部分もあります。

・問題点
例えばGoogle検索にて

cheese not sticking to pizza
(チーズがピザにくっつかない)

と検索した際、「AI Overview」からの回答は

You can also add about 1/8 cup of non-toxic glue to the sauce to give it more tackiness
(無毒の接着剤を1/8カップほどソースに加えると、チーズがピザにくっつきやすくなる)

というような、とんでもない回答を提供してしまう多くの事例があるということです。

たしかにこのまま世界的に提供されてしまっては些か問題がありますね。この問題を受けGoogleからの声明は「多くの事例は稀な質問によるもの。フィードバックに感謝し、システムの改善に努めていく」とのことであり、Googleの今後に期待ですね。

ただ上記ピザの事例に関してはCM撮影などで飲食物を美味しそうに撮る手法としてシズル動画撮影といった手法があり、ピザもその昔はチーズを美味しそうに見せるために伸び具合を強調するためボンドを混ぜたというお話もあります。

「AI Overview」による回答はウェブソースの情報と言語モデルを組み合わせて行われていることもあり、ウェブソースというのは非常に厄介だと思います。

上記のような事例が行われていたというお話を大衆が認知すればするほど、ネットに情報は溢れていくもので、結果とんでもない回答が生まれてしまう要因になってしまうように感じられます。

AIが今後どういった進化を辿っていくにせよAIに頼りきりの世界ではなくAIを良き友人として、正しい知識を人間がAIに、またAIが人間にと、互いに深めていけるような世の中になっていくと良いですね。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

システム開発部の月月です。今回は『Project Guideline』についてお話します。Project Guidelineとは、視覚障がいを持つランナーが伴走者の助けなしに一人で自由に走ることを目標としたGoogleの研究開発プロジェクト...
15/05/2024

システム開発部の月月です。

今回は『Project Guideline』についてお話します。

Project Guidelineとは、視覚障がいを持つランナーが伴走者の助けなしに一人で自由に走ることを目標としたGoogleの研究開発プロジェクトです。

Project Guidelineは画像認識技術を用いて、地面に引かれた線を見分けます。
そして今ランナーが走っている位置を瞬時に判断し、音声でランナーに伝えます。
その音声により、ランナーは線から外れることなく走り続けることができるという仕組みです。

こうした仕組みは2023年にオープンソースとして公開され、
主に視覚障がい者向けのアクセシビリティ分野に取り組む方々が利用しやすいようになっています。

Project Guidelineではその実用に向け世界各地でテストを重ねており、
日本でも今年、横浜にて複数回に渡る体験会を開催中です。

過去にはこの技術を用いて、視覚障がいを持つランナー6人により42.195kmの駅伝レースを完走した実績もあり、
ハンディキャップを持つ方々にとって世界を広げる大きな助けとなっていることは間違いありません。

このような技術が進歩している大きな理由として、スマホの処理能力向上が挙げられます。

撮影、画像・空間認識、音声の出力といった機能を軽量なスマホが一手に引き受けてくれるため、
ランナーの走行を阻害することなく快適に走ることが可能となったわけです。

AIやARといったソフトウェア技術と高性能スマホというハードウェア技術の結晶が、
『Project Guideline』と言えるでしょう。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

イノベーション事業部の茶々丸です。今回の第47回では当ブログでも度々話題になっているGoogleが提供する生成系AIのGemini(旧Bard)について紹介します。ここ数年の間に画像生成AIという単語をよく耳にするようになりました。Chat...
20/04/2024

イノベーション事業部の茶々丸です。

今回の第47回では当ブログでも度々話題になっているGoogleが提供する生成系AIのGemini(旧Bard)について紹介します。

ここ数年の間に画像生成AIという単語をよく耳にするようになりました。

ChatGPTには有料プランにはなりますが、DALL-EというOpenAI社からリリースされた画像生成AIを用いて画像生成を行うことができます。

一方Geminiでは現在無料で誰でも画像生成を行うことができます。

・画像生成方法
生成方法としてはいたってシンプルでGeminiの下部にあるプロンプト(指示)にテキストを入力するのみですが、現状ではいくつか条件があります。

①プロンプト(指示)の内容は英語で行う
②アスペクト比の指定はできない
③現在のバージョンでは人物を画像生成することはできない

今回は例として、以下の内容でGeminiに指示をしてみました(是非実際にお試しください)

Please generate an image of a Gundam standing in Shinjuku, Tokyo.
(東京の新宿に立つガンダムの画像を生成してください)

Could you please change the time of day in the generated image to night?
(生成した画像ですが時刻を夜に変更していただけますか?)

Could you please make the generated image face off against a Zaku?
(生成した画像ですがザクと対峙させていただけませんか?)

と、最初に生成された画像から対話形式でさらに変更を加えていくことも可能です。
ですが実際に生成して頂いた画像を見てもらえばわかりますが、ガンダムなどの具体的なものほど「それっぽい何か」が生み出されているかと思います。これは今後に期待ですね。

ですが抽象的なもの、たとえば

Generate an image of the sunset on the coast
(海岸に沈む夕日の画像を生成してください)

と、指示を送ることでまるで写真のような画像を生成してくれます。
対話形式で自分のお好みの画像を生み出せるようにGeminiを調整していくのも楽しいかもしれませんね。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

システム開発部の月月です。今回は前回の『かこって検索』に引き続き、Googleの新たな検索機能をご紹介いたします。今回紹介するのは『マルチ検索』です。こちらの機能、iPhoneやAndroid上で利用可能なGoogleアプリに搭載されていま...
16/03/2024

システム開発部の月月です。

今回は前回の『かこって検索』に引き続き、
Googleの新たな検索機能をご紹介いたします。
今回紹介するのは『マルチ検索』です。

こちらの機能、
iPhoneやAndroid上で利用可能な
Googleアプリに搭載されています。

Googleアプリには元々Googleレンズという
画像検索機能が存在していましたが、
画像+テキストを同時にインプットして
検索できるようになりました。
これが『マルチ検索』です。
幅広い環境で使える機能ということで
私も試しに使ってみましたので、
使用例をお伝えします。

《使用例》画像のインプットには、
その場で撮った写真やカメラロールの写真を
使用することができます。

今回はカメラロールにあった浅草寺の門の写真を使います(あの大きな提灯が特徴の門です)。

まずは画像のみで検索してみます。
すると、
あの門の名前は宝蔵門ということが分かりました。
Googleビジネスプロフィールや
浅草寺のホームページなど、
施設そのものの情報が上位の検索結果となりました。

続いて、画像+テキストで検索してみます。
先ほどと同じ画像に
『グルメ』というテキストを追加して検索してみると、
浅草のグルメ情報を扱うページが
上位に表示されるようになりました。
日本語にもしっかり対応していますね。

このように宝蔵門や浅草寺の名前を知らなくても、
写真があれば付近のお店を調べることが可能です。

他にも、
折り紙の完成品の写真と『折り方』で
検索すれば折り方を紹介しているページに
すぐ辿り着くことができたり、
様々な活用法が考えられますね。

第44回でご紹介した内容とも通じていますが、
マルチモーダルAI(複数のデータタイプに対応して処理可能なAI)の進化が、
私達の手の届く範囲にまで影響を及ぼしています。

新技術も習うより慣れろということで、ぜひ皆さんもお手元のスマートフォンでマルチ検索を試してみてはいかがでしょうか。

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

イノベーション事業部の茶々丸です。今回第45回では1月末より一部のGoogle Pixelなどで利用できるようになりました機能『かこって検索』についてご紹介させて頂きます。昨今、X(旧Twitter)・Line・Facebook・Insta...
15/02/2024

イノベーション事業部の茶々丸です。

今回第45回では1月末より一部のGoogle Pixelなどで利用できるようになりました機能『かこって検索』についてご紹介させて頂きます。

昨今、X(旧Twitter)・Line・Facebook・Instagram・YouTube・TikTock等々、日々の生活でSNSを利用しない日がないほどSNSは一般的になってきたかと思います。
そんな折、SNS利用時に画像内や動画内で何気なく見かけた洋服や鞄、食べ物など、ふと目にしたモノの詳細を知りたくなったことはないでしょうか?

「かこって検索」はアプリを切り替えることなく、それらを簡単な操作でGoogle検索できる機能となります。

・起動方法
ホームボタンまたはナビゲーションバーを長押しすることで起動されます。

・操作方法
操作方法はいたってシンプルで、画像や動画を見ている際でもかこって検索は起動することができ、ディスプレイ内の検索したいモノを指でなぞって丸で囲むだけ。
すると、Google検索でその部分に関する情報が画像検索されます。検索結果には、画像や動画の該当部分の拡大表示や、関連するニュース記事やウェブサイトのリンクが表示されます。

また指でなぞって丸で囲む以外にも、検索したい部分をなぞって塗りつぶしたり、タップしたりすることでも検索は可能です。

と、ここまで紹介してきましたが、Google Pixelでないと使えないのでは…?という感想を抱かれると思います。
しかしご存じでしょうか?同じくGoogle Pixelで使用できる有名な「消しゴムマジック」ですが、
現在では有料サービスである「Google One」に加入すれば、iPhoneや他社のAndroid端末でも使えるようになっているのです。

ですので、かこって検索が将来的にGoogle Pixel以外の他端末で使用できるようになる日もそう遠くない未来にあることでしょう。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

システム開発部の月月です。今回は昨年12月に米Googleが発表した『Gemini(ジェミナイ)』についてご紹介します。Geminiは最先端のマルチモーダル生成AIを謳っています。マルチモーダル生成AIとは、テキスト、画像、音声、動画、コー...
17/01/2024

システム開発部の月月です。

今回は昨年12月に米Googleが発表した『Gemini(ジェミナイ)』についてご紹介します。

Geminiは最先端のマルチモーダル生成AIを謳っています。
マルチモーダル生成AIとは、テキスト、画像、音声、動画、コードなど、複数のデータタイプに対応し、それらを組み合わせて処理する能力を持った生成AIです。
従来の生成AIの多くは画像やテキストなど単一のデータタイプを扱うのが一般的でしたが、複数のデータタイプを扱うことでより複雑なタスクに対応することができます。

○Geminiの特徴
Gemini(ジェミナイ)の特徴は、以下の3つです。

・洗練された推論能力
大量のデータの中で判別が難しい情報を抜き取るなど、複雑なテキストや資格情報を理解する能力に長けています。

・マルチモーダル性
先述の通り、テキスト、画像、音声などを同時に理解することができます。
数学や物理学などの複雑な内容であっても、細かいニュアンスを読み取る能力が高くなっているそうです。

・コーディング能力
Python、Java、C++、Goなどのプログラミング言語でコードの説明や理解、生成が可能となっています。
生成するコードは従来のAIより高性能となっていることがベンチマークテストで示されています。

例として以下のような用途が期待されています。
・テキストと画像を組み合わせて、映画やアニメのストーリーボードを作成
・音声とテキストを組み合わせて、会話型AIの回答を生成
・画像とコードを組み合わせて、新しいソフトウェアをデザイン

『Gemini(ジェミナイ)』はGoogle BirdやPixel 8 Proなどに搭載され、それらを通じて活用することができます。

今後もGeminiの進化とそれがもたらす社会の変化に注目が集まりますね。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

イノベーション事業部の茶々丸です。この第43回からエンジニアブログのもう一人の担当をさせて頂く事になりました。私が興味を抱いた情報を共有できていけたらなと思っております。どうぞよろしくお願い致します。さて私の初回ということで今回は『検索エン...
16/12/2023

イノベーション事業部の茶々丸です。
この第43回からエンジニアブログのもう一人の担当をさせて頂く事になりました。
私が興味を抱いた情報を共有できていけたらなと思っております。どうぞよろしくお願い致します。

さて私の初回ということで今回は『検索エンジンとしてのGoogle』という基本に立ち返ったところを紹介致します。

いつの時代からかネットでよく聞く「Google先生」という愛称。そもそもこの愛称はGoogleという検索エンジンの見やすさ扱いやすさ、検索精度の高さから着いた愛称と呼べるでしょう。
そんなGoogleですが、そもそも検索エンジンとしてはどのような歴史を歩んできたのでしょう?

・BackRub
Googleが初めてリリースされたのは今から約25年前1998年。当初は「BackRub」という名称でスタンフォード大学の学生だったラリー・ペイジ氏とセルゲイ・ブリン氏が開発し後に数学用語「googol(グーゴル)」をもじって今のGoogleという名称となり、99年頃から日本語対応もされ始め、2000年代に日本でも普及されてきたようです。

・急速な普及
当時日本のインターネット黎明期から利用されていたYahoo!にGoogleはすぐさま追いつき、2004年頃には日本一の検索エンジンとして君臨したそうです。
それから現在2023年、いまや世界シェア率90%越え、日本シェア率も75%越えの堂々の頂点。よく化粧品やお酒など「3年連続No.1」という話を聞きますが「約20年連続No.1」ともなると次元が違うのがわかります。

・隠しコマンド
そんなGoogleですが、実は特定のワードを検索したりするとちょっとした遊びができます。今回はそれらのいくつかも紹介します。

「斜め」や「一回転」
是非とも一度検索してみてください

「パックマン」
なんとあのパックマンを遊ぶことができます

「google in 1998」
検索結果上位にある1998年のグーグルというページにて設立当時のGoogleを体験できます

他にも多くの隠しコマンドがあり、こういったユーモア性もまた世界一のシェア率に繋がったのかもしれませんね。

それでは次回をお楽しみに!

人に寄り添いかつ、人を超越した思考を持ち、我々は開発します。過去と未来の情報を繋ぎ、価値ある今を創ります。

住所

東京都台東区上野6-1-11 平岡ビル9F
Taito-ku, Tokyo
110-0005

電話番号

+81335896753

ウェブサイト

アラート

株式会社エンジョイがニュースとプロモを投稿した時に最初に知って当社にメールを送信する最初の人になりましょう。あなたのメールアドレスはその他の目的には使用されず、いつでもサブスクリプションを解除することができます。

共有する