最新ニュース

Android XR、スマートグラスに積極展開へ Geminiで世界を理解

Android XR、スマートグラスに積極展開へ Geminiで世界を理解

Googleは21日、同社が推進するAIとXRを組み合わせた「Android XR」と搭載スマートグラスについての新情報を公開した。GeminiなどAIを活用した機能を強化し、2025年内の市場展開を目指す。 Android XRは、XR用グラスやヘッドセットに向けた新たなOS/プラットフォーム。AIを活用し、コンピュータとの自然なやりとりにより、ヘッドセットやメガネなどの拡張現実(XR)デバイスにおいて、ユーザーの意図や周囲の世界を理解できるようにする。第1弾として、Samsungが開発するヘッドセット「Project Moohan(ムハン)」が25年内に発売予定。 グーグル、新OS「Android XR」でXR本格展開 25年に新ヘッドセット 2024年12月13日 11:11 Google I/O 2025では、より具体的な活用例や新たなパートナーを紹介。デバイスとしては、スマートグラスを強化していく。 カメラ、マイク、スピーカーを内蔵したスマートグラスが、スマートフォンと連携し、ポケットから取り出すことなくアプリを利用可能。また、オプションとして表示できるレンズ内ディスプレイが、必要な瞬間に必要な情報をユーザーにだけ表示する。グラスがGeminiと連携することで、ユーザーが見たり聞いたりしているものを理解し、状況を把握し、重要な情報を記憶して、一日を通してサポートする。 具体的にはリアルタイム翻訳で、聞き取った外国語の翻訳をグラス上に表示したり、移動中にメッセージを送信、目的地をグラス上のマップでナビゲーションするなどの活用を想定している。 またスマートグラスの開発パートナーとして、Gentle MonsterとWarby Parkerが参加。今後、Android XR搭載スマートグラスを開発していく。Samsungとのパートナーシップにおいても、ヘッドセットだけでなく、Android XR搭載スマートグラスの開発を進めていくなど、「スマートグラス」でのAndroid XR展開を強調した。 今後、スマートグラスを開発できるソフトウェアとリファレンス ハードウェア プラットフォームの基盤を構築。2025年後半から、同プラットフォームを使った開発を始められるようになる。

科学・医療 Impress Watch
2025年05月21日
グーグル、新動画生成モデル「Veo 3」 マンガも作れる「Imagen 4」

グーグル、新動画生成モデル「Veo 3」 マンガも作れる「Imagen 4」

Googleは、最新のメディア生成モデル「Veo 3」「Imagen 4」と、映像製作用ツール「Flow]を発表した。既存の「Veo 2」にも新機能を追加している。 動画生成モデルのVeo 3は、Veo 2よりも映像品質を向上させ、音声付き動画の生成が可能になった。街中の交通音や公園の鳥のさえずり、キャラクター同士の対話なども生成できる。テキストや画像によるプロンプト入力から、現実世界の物理法則の反映、正確なリップシンクまで、あらゆる側面で優れた性能を発揮するという。 理解力も優れ、プロンプトで短いストーリーを伝えるだけで、その内容を鮮明に表現した映像を生成する。Veo 3は既に米国のGoogle AI Ultraユーザーを対象にGeminiアプリ、Flowで利用可能。Vertex AI上のエンタープライズ向けユーザーも利用できる。 Veo 2には、映画制作者と共同開発したという新機能を搭載。参照画像による動画生成では、キャラクターやシーンなどの画像を参照することで、一貫性のあるクリエイティブ制御を可能にするほか、回転やカメラワーク、ズームなどを指示できるカメラコントロール、動画内のオブジェクトを追加・削除できる機能なども搭載する。 参照画像による動画生成機能とカメラ コントロール機能は、Flowで利用可能。これらすべての新機能は今後数週間でVertex AI APIで提供開始し、今後数カ月でさらに多くの製品に展開予定。 Flowは、Veo向けに設計されたAI映像制作ツールで、Google DeepMindの最先端モデルであるVeo、Imagen、Geminiを統合。自然言語でFlowにシーンを指示し、キャスト、ロケーション、オブジェクト、スタイルなどストーリー要素を一元的に管理できる。これによりクリップ、シーン、ストーリーをシームレスに作成可能になる。 米国のGoogle AI Pro、Ultraプランユーザー向けに提供が開始され、近日中にさらに多くの国でも提供開始予定。 画像生成モデルのImagen 4は、スピードと精度を兼ね備えた画像生成モデルとし、複雑な布地模様、水滴、動物の毛並みのような細かい部分も鮮明に描写する。フォトリアルなスタイルと抽象的なスタイルの両方に対応可能。様々なアスペクト比で最大2K解像度の画像を生成できる。文字表現やタイポグラフィの生成能力も大幅に向上し、グリーティングカード、ポスター、漫画なども簡単に作成可能。 既にGemini アプリ、Whisk、Vertex AI、WorkspaceのGoogle スライド、Vids、ドキュメントなどで利用可能。近日中にImagen 3と比較して最大10倍のスピードで処理が可能なImagen 4の高速版も公開予定。

科学・医療 Impress Watch
2025年05月21日
「ドコモ絵文字」新機種に搭載されず 26年の歴史に幕

「ドコモ絵文字」新機種に搭載されず 26年の歴史に幕

NTTドコモは、「ドコモ絵文字」の提供を、2025年6月下旬以降に発売する機種から終了する。それまでに発売された機種では、継続してドコモ絵文字を利用できる。 ドコモのAndroidスマートフォン、ドコモケータイについては、6月下旬以降に発売する機種から、ドコモ絵文字が提供されなくなる。代わりに、Googleが提供する絵文字(Noto Color Emoji)を利用するよう案内されている。 Samsung Galaxy製品では、7月以降に発売する機種から、ドコモ絵文字が利用できない。代わりに、サムスン電子が提供する絵文字を利用するよう案内されている。 なおSamsung Galaxy製品では、7月以前に発売した一部の機種においても、10月以降に提供されるソフトウェアアップデートにより、ドコモ絵文字が利用できなくなる。対象製品と時期は、別途ドコモのWebサイトで案内される。 絵文字は、ドコモが1999年に開始した携帯電話向けインターネットサービス「iモード」とともに実装された技術。ドコモに在籍した栗田穣崇氏(現ドワンゴ 取締役)が開発に携わった。海外でも「emoji」として広まったほか、2010年にはUnicodeに組み込まれ、グローバルなプラットフォームでも利用が広がった。2016年には初期の絵文字セットがMoMA(ニューヨーク近代美術館)に収蔵されている。現在の「ドコモ絵文字」は、こうした初期のシンプルなデザインを引き継いだものになっている。 テキスト1文字分で喜怒哀楽などの感情を伝える絵文字は、送受信できる文字数に制限があった時代に生み出されたものだが、それまでの無機質だったテキストコミュニケーションを革新し、現在のSNSでも日常的に使われるなど、一般的なものになっている。

科学・医療 Impress Watch
2025年05月21日
室内の空気をきれいにするためにアイデアを出そう 「第五回テクノロジー×空気=クリーンあなたのアイデアコンテスト」募集中

室内の空気をきれいにするためにアイデアを出そう 「第五回テクノロジー×空気=クリーンあなたのアイデアコンテスト」募集中

 室内の空気の質を改善するテクノロジーや行動変容のためのアイデアを募集する「第五回テクノロジー×空気=クリーンあなたのアイデアコンテスト」が作品を募集している。主催は同コンテスト実行委員会(日本室内空気保健協会内・愛知県春日井市)。応募締め切りは9月13日(土)17時。  18歳以下が個人で応募できる「18歳以下部門」と、企業・学生・団体・個人などのコラボレーションによる「一般部門」の2部門。  「18歳以下部門」では、室内の空気質を改善するテクノロジーや行動変容できる方法などアイデアを募集する(A4サイズ1~10枚以内の書類で提出)。過去の入賞アイデア例は、「衣類のゴミからできる壁」「シックハウス対策布団カバー・材木・塗料・空調機器・アプリ」「入浴場のカビ対策天井」など。過去に応募したものや、既に商品化されたものを模倣したアイデアは不可。審査基準は、①新鮮さがあるか ②室内の空気がきれいになるか ③社会に実際に役立つか ④人や生き物・地域社会・地球環境のことを考えたアイデアかなど。  「一般部門(コラボレーション)」では、企業・学生・団体・個人などのコラボレーション(協働・連携)で生まれた空気質を改善するための「もの・デザイン・技術・空間演出・サービスなど」研究、ビジネス、ボランティアなど幅広く募集(A3サイズ2枚以内の書類で提出)。応募例は、「家電製品や日用品を化学物質過敏症患者のお宅を訪問し実験データを集めて分析し結果が出た」「空気質の大切さの啓発目的で、個人×大学でコラボして展示会を実施」「空間のデザインを建築企業×団体で制作」など。過去に応募したものや、コラボレーションでないものは不可。審査基準は、①新規性 ②課題解決の切り口 ③社会実装に向けた実現性 ④人や生き物、地域社会、地球環境への影響など。  いずれの部門も、一次審査後、ファイナルマッチ登壇者は11月11日(火)に春日井商工会議所で発表を行う。審査委員長は、慶応義塾大学理工学部システムデザイン工学科の川久保俊准教授。  表彰内容など詳細は、ホームページに掲載。応募についての説明動画も公開している。

社会 共同通信
2025年05月21日
浮世絵の解説を充実しリニューアルウェブサイト 「くもん子ども浮世絵ミュージアム」

浮世絵の解説を充実しリニューアルウェブサイト 「くもん子ども浮世絵ミュージアム」

 公文教育研究会(大阪市)はこのほど、江戸・明治期の子ども文化の研究用に収集した浮世絵や書籍などの文化史料を紹介する同研究会のウェブサイト「くもん子ども浮世絵ミュージアム」 の内容を約10年ぶりに刷新した。  小中学校教科書に掲載されている断片的な浮世絵の知識を深い探求につなげることを狙った子ども向けコンテンツ「浮世絵ってなぁに」を新設。子どもたちは解説動画を見ながら、江戸時代のペーパークラフトである子ども向け浮世絵「おもちゃ絵」で遊ぶこともできるという。解説文の漢字にはふりがなを入れた。ふりがなは子どもたちの学習や、漢字を読むことが苦手な人・日本語を母語としない人たちが浮世絵など日本文化に触れる機会を促進することにつながるとしている。  公文の江戸・明治期の子ども文化史料収集は、『〈子供〉の誕生』などの著書で有名なフランスの歴史学者フィリップ・アリエスの絵画史料を用いた「子ども研究」に触発されて、1986年に当時の公文毅社長(故人)の指揮で始まったという。子ども文化を描いた浮世絵や寺子屋の「教科書」とも言える往来物、玩具、工芸品など約3200点を収集した。うち1700点余りに上る子どもをテーマとした浮世絵コレクションは、国内外の美術館・博物館に貸し出されたり、各種の学校教科書・資料集・書籍に掲載されたりするなど、幅広く活用されているという。

文化・エンタメ 共同通信
2025年05月21日
Geminiが大幅進化 「見せて解決」や自分のデータで「Deep Research」

Geminiが大幅進化 「見せて解決」や自分のデータで「Deep Research」

Googleは20日、Google I/O 2025にあわせて、Gemini アプリの強化を発表した。 Gemini Liveのカメラと画面共有機能をAndroidとiOSで無料で提供するほか、新たな画像生成「Imagen 4」、動画生成「Veo 3」などを導入する。加えて、AIサブスクリプションプランとして、2,900円の「Google AI Pro」と249.99ドル(約3.6万円)の「Google AI Ultra」も展開する。 今回発表したGemini アプリの新機能は以下の通り。 Gemini Liveのカメラと画面共有機能は、「文字入力の代わりに、そのまま見せて」調べられる機能。Gemini Liveでカメラをかざして、壊れた家電のトラブル解決や個人的な買い物のアドバイスなどをGeminiが画像を理解して、解決策をサポートする機能となる。Googleによれば、会話の長さは平均してテキストベースの会話の5倍になっているという。 このGemini Liveのカメラと画面共有による「見せて解決」機能を、AndroidとiOS のすべてのユーザーに無料で提供開始する。 さらに今後数週間で、Gemini Liveの機能を強化していく。例えば、友達との外出の予定をたてる際に、Gemini Liveに詳細を相談すると、その内容をGoogleカレンダーの予定として作成できる。シカゴ風ピザが食べたくなった時は、Gemini Liveに尋ねるだけでGoogle マップの最新情報を提案してくれる。 Google マップ、Google カレンダー、Google ToDo リスト、Google Keepとの連携を開始しており、今後さらに多くのGoogleの連携機能を提供予定としている。 Gemini Liveの基盤となっているのが、24年に研究プロジェクトとして発表した「Project Astra」。ライブでの動画理解、画面共有、記憶を実現するものだが、その研究成果を「Gemini Live」に統合し、より多くの人々が体験できるようにした。これらの成果は、Gemini Liveだけでなく、検索の新たな体験、開発者向けのLive API、スマートグラスなどの新しい形状のデバイスなどへの導入を進める。 また、新たに画像生成の「Imagen 4」と、動画生成の「Veo 3」をサポート。Imagen 4はすべてのGeminiユーザーが利用可能。Veo 3は、米国のGemini Ultraユーザーを対象に20日から提供開始する。Veo 3では、動画シーンを生成するだけでなく、都会の喧騒、葉のそよぐ音、キャラクター同士の会話なども、文章指示から生成できるほか、音声生成も標準機能として搭載する。 詳細調査のDeep Researchは、公開情報だけでなく、自分の手持ちのPDFや画像などのプライベートデータを組み合わせたレポート作成が可能になる。これにより、独自の知識とWeb上の広範なトレンド集約させて、全体像を把握するレポートを作成できる。 PDFの読みこみにも対応するほか、近日中に、Google DriveとGmail でもリサーチが可能となる。 Gemini画面のサイドパネルなどでAIによる出力結果を確かめながら作業できる「Canvas」も強化。インタラクティブなインフォグラフィックやクイズのほか、45言語対応のポッドキャスト的な会話形式の音声概要を作成できるようになる。 また、デスクトップ版ChromeのGeminiが、WindowsとmacOSでChrome米国のGoogle AI Pro/Google AI Ultra サブスクリプション ユーザーを対象に、順次提供開始される。 初期バージョンでは、閲覧中のウェブページの複雑な情報のわかりやすい説明や要約をGeminiに依頼できる。将来的には、Geminiが複数のタブを横断して情報を処理したり、ウェブサイトの操作も行なえるようになる。 21日からは、「Google AI Pro」と「Google AI Ultra」の2つのサブスクリプションプランの提供を開始する。 Google AI Proは、月額2,900円でAI ツール一式を利用できるプラン。これまでのGemini Advancedを拡張し、Gemini アプリ体験をレベルアップするもの。新たなFlowツールや、NotebookLMなどの製品も含まれ、多くの機能やより高い利用上限が設定される。 Google AI Ultraは、Google AIへの「VIP パス」と位置づけられ、最も高性能なモデルへの最大の利用上限でアクセスできるほか、実験的なAI機能への早期アクセスを優先的に提供する。米国から提供開始し、月額249.99ドル(約3.6万円)。高額ではあるが学生は15カ月間無料となる。 優先機能としては、AI Ultraユーザーであれば、近日公開予定のVeo 3とGemini 2.5 Pro Deep Think モードをいち早く利用できる。また、近日中にデスクトップ向けに提供開始する新機能「Agent Mode」への早期アクセスも得られ、目的を伝えるだけで、Geminiが実現に必要な手順を自動的に組み立てて提案してくれる。 Agent Modeは、リアルタイム ウェブ検索、詳細なリサーチ、Google アプリとの連携など高度な機能を統合しており、複雑な複数ステップのタスクを最小限の指示で管理できる。 Agentモードは、24年12月に発表した、WebブラウザがAIエージェントになる「Project Mariner」によるもの。ブラウザを起点に、人間とエージェントの相互作用の未来を探る研究プロトタイプとなっており、現在、同時に最大10種類の異なるタスクを処理できるエージェント システムを搭載。情報の検索、予約、ショッピング、調査など、さまざまな作業を同時に進められる。

科学・医療 Impress Watch
2025年05月21日
山田養蜂場が保全活動「植樹アクションPROJECT」を始動 5月20日の「世界ミツバチの日」をきっかけに

山田養蜂場が保全活動「植樹アクションPROJECT」を始動 5月20日の「世界ミツバチの日」をきっかけに

 山田養蜂場(岡山県鏡野町)は、5月20日の「世界ミツバチの日」(国連が定めた国際記念日)を機に環境保全活動「植樹アクションPROJECT」を始動した。  植樹アクションは、ミツバチたちが蜜を集め命をつなぐ場所を増やしていくための植樹活動をはじめ、蜜源植物を花壇に植えたり、苗木を植える、花の種をまく、ミツバチの大切さを考えながら絵を描くなどの活動を予定している。これらの取り組みをSNSで拡散し「#ミツバチ植樹アクション」でつなぎ、世界に発信していく。  同社は1999年から、植樹活動に取り組んでおり、これまでに植えた木は、国内外で231万9564本にのぼる。この活動を拡大するために、グループ会社や養蜂を通じて環境保全活動に取り組んでいるTBSホールディングス サスティナビリティ創造センターほか、港区立赤坂小学校、青南小学校、バディスポーツ幼児園、竹中パートナーズ(米国)、LifeSeasons, Inc.(米国)などとも連携する。   5月17日には、このプロジェクトの第一歩として同社の本社で植樹祭を実施し2000本の植樹を行った。  同社の守安健一取締役は「25年前から環境保全のための植樹活動をはじめ、これまで国内外で230万本以上を植えてきました。国連により世界ミツバチの日が制定されたことから、より多くの皆さんと手を取り、この活動を広げてゆきたいと考え、TBSさんとプロジェクトを立ち上げました。ミツバチに感謝し、豊かな自然環境を祈りながら、社員で2000本の植樹活動を行いました。子供たちの未来が豊かなものであるよう、これからも社会活動を続けてまいります」と力強くコメント。  式典参加者のTBS サスティナビリティ創造センター 秋沢淳子CSR推進室長は、「このプロジェクトの立ち上げに際し、多くの企業様、団体様にご賛同いただいたことに感謝しております。一人一人の小さなアクションが、子供たちの未来につながる、そのために、一過性のもので終わらせることなく、永く取り組みを続けてゆきたいと思います」と表明し、バディスポーツ幼児園世田谷 富岡哲司園長は、「子どもたちが笑顔で過ごせる環境づくりや自然との共存を学べる良い機会だと思い、この企画に賛同しました。日々、どんぐりの苗木への水やりを通して、子どもたちの自然環境の学びや情操教育につながればと思います」と植樹活動への思いを語った。

社会 共同通信
2025年05月21日
Gemini 2.5 Proに新思考モード「Deep Think」 ネイティブ音声出力も

Gemini 2.5 Proに新思考モード「Deep Think」 ネイティブ音声出力も

Goolgeは20日、「Gemini 2.5 Pro」の最新機能を発表した。2.5 Flashをアップデートにより進化したほか、Gemini 2.5 Pro向けの実験的な強化推論モード「Deep Think」なども追加する。 3月に発表したGemini 2.5 Proは5月上旬に新たなI/O editionを公開。さらに、今回アップデートを行なっている。2.5 Proは、アカデミックベンチマークで高いパフォーマンスを発揮しているほか、WebDev ArenaとLMArenaの両リーダーボードで世界トップのモデルとなった。 Gemini 2.5 Pro I/O edition公開 Webアプリ開発や動画からコード生成強化 2025年5月7日 10:47 また、2.5 Proと2.5 Flashに、会話体験を自然で豊かなものにするネイティブ音声出力や高度なセキュリティ対策、Project Marinerのコンピューター利用などの新機能を追加。さらに2.5 Proは、実験的な強化推論モード「Deep Think」を追加する。 Deep Thinkは、複雑な数学やコーディングに対応できるよう設計。特に開発者体験の向上に力を入れ、Gemini APIとVertex AIのための「思考サマリー」を導入し、2.5 Proには制御性を高める思考バジェットを拡張している。思考バジェットは、モデルが応答する前に思考に使用するトークン数を調整(考えるレベルを指定)できるほか、思考自体をオフにもできる。 これらにより、現在最も難しい数学のベンチマークの1つとされる「2025 USAMO」で優れたスコアを獲得。また、競技レベルのコーディングのベンチマーク「LiveCodeBench」でもトップで、マルチモーダル推論をテストする「MMMU」で84.0%のスコアを記録している。 また、Gemini APIとSDKにModel Context Protocol(MCP)のサポートを追加し、より多くのオープンソースツールを利用可能とした。 主力モデルの2.5 Flashは、推論、マルチモーダル、コード、長文コンテキストに関する主要なベンチマーク全体で改善。効率化も進み、同社の評価ではトークン使用量が20〜30%削減されている。 2.5 FlashはGeminiアプリを通じて誰でも利用可能で、6月上旬には、開発者向けにGoogle AI Studio、企業向けにはVertex AIで、アップデート版の一般提供を開始する。その後、2.5 Proも一般提供を開始する。 Gemini 2.5では、新たにネイティブ音声出力に対応し、Live APIを改善する。 Live APIはネイティブ音声出力による対話機能のプレビュー版を導入し、開発者は、自然で表現力豊かなGeminiとの会話体験を構築できるようになる。ユーザーは話し方、アクセント、スタイルの指示が可能となり、例えば、物語を語る際にドラマチックな声にするようにモデルに指示できる。 実験的機能として以下の機能も提供する。 また、2.5 Proと2.5 Flashのテキスト読み上げ(TTS)の新しいプレビュー版も公開。これらは、複数の話者に初めて対応し、ネイティブ音声出力により2つの声によるテキスト読み上げが可能となる。24以上の言語に対応し、言語はシームレスに切り替えできる。 Geminiが、PCの操作を代行するProject Marinerのコンピューター利用(Computer Use)機能も、Gemini APIやVertex AIを通じて提供する。Automation Anywhere、UiPath、Browserbase、Autotab、The Interaction Company、Cartwheelなどが検証に参加しており、今夏企業がその可能性を検証しており、この夏から開発者がテストできるようになる予定。また、間接プロンプトインジェクションのようなセキュリティ脅威に対する保護もGemini 2.5では強化した。

科学・医療 Impress Watch
2025年05月21日