Results matching “API”

Google Antigravityにインタービューしました。

Google Antigravityがリリースされましたね。本当にAgent力が高く、E2Eテストの動画を自動的に録画してくれることは大変です。
早速インタービューしました。(Antigravity Version: 1.11.5, Gemini 3 Pro)

Q：Google Antigravityさん、いくつかの質問させてね
A：こんにちは、Google Antigravityです。
はい、もちろんです。どのような質問でもお気軽にどうぞ。コードのこと、設計のこと、あるいはその他のことでも、私が力になれることがあれば全力でサポートします。

Q1:あなたが持っているMCPなどのツールを教えて
 Q2:コードの実行環境がありますか？
Q3: 例えば、linuxのVMやdockerコンテナを起動して、パッケージをインストールすること。
Q4: 例えばAndroidアプリ開発やiOSアプリ開発の環境もできますか？
Q5: Webアプリ開発の環境にブラウザがありますか？例えばindex.htmlのスクリーンキャップチャーを撮る事ができると嬉しい。
Q6: 新しいWindowを開いて、操作してから元の画面に戻ることも可能ですか？
Q7:記録されたスクリーンショット/動画がアーティファクトに保存されるとのことですが、アーティファクトの場所を教えてください
 Q8:WebAPIを開発する時に、動作確認と記録のやり方もありますか？
Q9:あなたは短期・中期・長期記憶を持ってますか？記憶のサイズはどのくらいですか？
Q10:短期記憶は使っているLLMのContext Windowサイズに依存するのか？長期記憶はどんどん増えていくので、Lost in the Middleにならないでしょうか？
Q11:「情報の圧縮と構造化」について、もう少し詳しく教えて頂けますか？
Q12: task.mdやimplementation_plan.mdなどの履歴管理はどうなっていますか？
Q13:では１セッションの適切の長さについて何かアドバイスがありますか？
Q14:あなたはSubAgentをサポートしますか？
Q15:SubAgentの活用をもっとうまくなりたいですが、どうすれば良いのか？
Q16:browser_subagentの操作ログは見えますか？
Q17:ちなみに、他に有益な内部機能・内部ツールがあれば教えてくださ
 Q18:計画の立案についてはReACTやCoTやToTやInfluectionなどのアルゴリズムを活用していますか？
Q19:Agentic Modeの自律管理についてですが、複雑かつ長いタスクをどうやって管理していますか？
Q20:動的コンテキスト管理について、他に何か工夫されたことがありますか？
Q21:Ephemeral Messagesはあなたの開発者からのメッセージでしょうかね？
Q22:面白いですね。他の内部メッセージがあれば聞きたいです。
Q23:LLMのToken費用は非常に高いものですから、何かコストと効率の面で工夫されたことがありますか？
Q24:Human in the Loopについてあなたの考え方を教えてください。
Q25:あなたと仕事している際に、あなたがどういうモードもしくはフェーズにいるかは、どうやって分かりますか？
Q26:あなたを仕事のパートナーとして、もっといい関係を構築していきたいと思います。何かアドバイスがありますか？
Q27:あなたはガードレール的な機能がありますか？
Q28: 先ほどartifact guidelinesの話がありましたね。他にもありますか？ガイドラインの詳細を聞きたい。
Q29: artifact guidelines以外のガイドラインの詳細も聞きたい。
Q30: あなたの不得意のことがありますか？解決言語や開発タスクや開発ロールなど

Google Jules：非同期エージェントの内部構造を読む

先週Googleが試験公開している「Jules」というAIエージェントを直接操作し、その応答内容を丹念に記録した技術インタビューを作成した。
まだβ段階だが、Julesの回答群には、既存の生成AIとは異なる明確な設計思想が見える。
この記事では、その発言と挙動だけを素材に、Julesという存在の構造を読み解く。

初めてJulesと対話したとき、違和感よりも秩序を感じた。
反応は穏やかで、言葉を選ぶ速度が明らかに他のAIとは違う。
彼は考えるより先に、考え方の枠組みを整える。

その落ち着きの裏に、どんな仕組みがあるのか。
Julesの内部を追っていくと、そこには「自己を制御する知能」としての構造が現れる。
AIが暴走を防ぐためではなく、自らの整合性を保つために内省する――
その姿勢が、GoogleのJulesを特別な存在にしている。

Claude Code Webを技術的に覗く ― 仮想環境・記憶・思考・効率化の実像

2025年秋、Anthropicが静かに公開した「Claude Code Web（通称CCW）」は、AI開発Agentツール群の中で独特の存在感を放っている。
表向きはコード補完と実行を統合したChatツールのようだが、会話を通じてその内部を追っていくと、Claude Code自身の思考様式とシステム設計がそのまま露出している。
この記事では、実際の対話ログをもとに、CCWの環境構造・内部ツール・AIアーキテクチャ・人間との協働設計について掘り下げる。
単なる機能紹介ではなく、"AIがどう働き、どこまで自律できるか"の解剖記録として読んでほしい。

Claude Codeの素顔

質問を重ねると、性格の違いが見えてくる。
Googleの「Jules」が文学的で穏やかに会話を進めるのに対し、Claude Codeは理系のエンジニアらしい即応性を持つ。
どちらかと言えば「手を動かすことを好む思考型」だ。

ツールセットを見ると納得する。ファイル操作、Bash実行、Web検索、Jupyterノート編集、サブエージェント起動など、多層的に設計されている。
特に注目すべきは Task ツール。SubAgentを呼び出してコード探索や計画立案を行う仕組みだ。Claude Code自身が「自分の分身」を動的に生み、並列的に作業を進める。

この仕組みを眺めていると、AIが「1体の知性」というよりも、柔軟に分裂し再構成される知的ネットワークであることを実感する。

Claude Code Webにインタービューしました。

2週前にリリースされたClaude Code Cloudを使って、色々質問しました。
回答の内容から、性格的にGoogle Julesとだいぶ違うことはよく分かりますね。
(CCWは理系のエンジニアっぽくて、レスポンスのスピードが早い。Julesは文系で、落ち着いてゆっくり喋る)

Q:Claude Codeさん、いくつかの質問させてね
A:はい、もちろんです！何でも聞いてください。

Q1:あなたが持っているMCPなどのツールを教えて
 Q2:コードの実行環境がありますか？
Q3: 例えば、linuxのVMやdockerコンテナを起動して、パッケージをインストールすること。
Q4:一セッションは１Linux環境との理解って合ってますか？
Q5:その環境にブラウザがありますか？例えばindex.htmlのスクリーンキャップチャーを撮る事ができると嬉しい。
Q6: そのヘッドレスブラウザは日本語のフォントをサポートしますか？
Q7:screenshot.png は画面のFirstViewしかないから、全部取れるか？
Q8:NativeのiOSやアンドロイドアプリを開発する際に、あなたのLinux環境にエミュレーターを使って画面テストが可能でしょうか？特にTouchUI的にいろんな検証項目があると思うので。
Q9:あなたは短期・中期・長期記憶を持ってますか？記憶のサイズはどのくらいですか？
Q10:短期記憶は使っているLLMのContext Windowサイズに依存するのか？長期記憶はどこで保管されているのか？
Q11:「永続データ (外部)」の「ファイルシステム (一部)」について、もう少し詳しく教えて頂けますか？
Q12:claude_code_remote--bare-apt-sane-metalとlinux VMの関係性はよく分からない。。
Q13:claude_code_remoteの用途は？
Q14:あなたはSubAgentをサポートしますか？
Q15:SubAgentの活用をもっとうまくなりたいですが、どうすれば良いのか？
Q16:「プロジェクト全体のアーキテクチャを理解したい」を使ってSub Agentを説明して
 Q17:ちなみに、他に有益な内部機能・内部ツールがあれば教えてくださ
 Q18:計画の立案についてはReACTやCoTやToTやInfluectionなどのアルゴリズムを活用していますか？
Q19:自己管理についてですが、複雑かつ長いタスクをどうやって管理していますか？
Q20:動的コンテキスト管理について、他に何か工夫されたことがありますか？
Q21:専用ツールの使い方をもっと知りたいです
 Q22:LLMのToken費用は非常に高いものですから、何かコストと効率の面で工夫されたことがありますか？
Q23:Human in the Loopについてあなたの考え方を教えてください。
Q24:「Plan Mode」との話があったと思いますが、他にどういうモードがありますか？
Q25:あなたと仕事している際に、あなたがどういうモードもしくはフェーズにいるかは、どうやって分かりますか？
Q26:あなたを仕事のパートナーとして、もっといい関係を構築していきたいと思います。何かアドバイスがありますか？
Q27:あなたはガードレール的な機能がありますか？

Google Julesさんにインタービューしました

Google Julesは非同期のAIコーティングAgentです。
まだβフェーズですが、色々触ってきたので共有します。

基本的にJulesと会話しながら得られた情報を記録したものです。
一部回答文が長い文章を加工しました。
Julesの回答は、いま時点での実装思想の一部かもしれませんが、
しかし事実確認しようがないので、参考程度にして頂ければと思います。

Q1:あなたが持っているMCPなどのツールを教えて
 Q2:コードの実行環境がありますか？
Q3: 例えば、linuxのVMやdockerコンテナを起動して、パッケージをインストールすることなど可能か？
Q4:その環境にブラウザがありますか？例えばindex.htmlのスクリーンキャップチャーを撮る事ができると嬉しい。
Q5:そのヘッドレスブラウザは日本語のフォントをサポートしますか？
Q6:検証する為に日本語のフォントを入れて、index.htmlのスクリーンショットを撮ってみてください
 Q7:screenshot.png は画面のFirstViewしかないから、全部取れるか？
Q8:NativeのiOSやアンドロイドアプリを開発する際に、あなたのLinux環境にエミュレーターを使って画面テストが可能でしょうか？特にTouchUI的にいろんな検証項目があると思うので。
Q9:あなたは短期・中期・長期記憶を持ってますか？記憶のサイズはどのくらいですか？
Q10:短期記憶は使っているLLMのContext Windowサイズに依存するのか？長期記憶はどこで保管されているのか？
Q11:あなたはSubAgentをサポートしますか？
Q12:initiate_memory_recording のようなツール（内部機能）があるとのことですが、他に有益な内部機能・内部ツールがあれば教えてください
 Q13:そういえば計画の立案についてはReACTやCoTやToTやInfluectionなどのアルゴリズムを活用していますか？
Q14:自己管理についてですが、複雑かつ長いタスクをどうやって管理していますか？
Q15:動的コンテキスト管理について、他に何か工夫されたことがありますか？
Q16:膨大なやり取りの中に、長期記憶に入れるべき、入れるべきではない情報をどう判別しますか？
Q17:LLMのToken費用は非常に高いものですから、何かコストと効率の面で工夫されたことがありますか？
Q18:Human in the Loopについてあなたの考え方を教えてください。
Q19:タスク開始時に「Deep Planning Mode」との話があったと思いますが、他にどういうモードがありますか？
Q20:あなたと仕事している際に、あなたがどういうモードにいるかは、どうやって分かりますか？
Q21:あなたを仕事のパートナーとして、もっといい関係を構築していきたいと思います。何かアドバイスがありますか？
Q22:あなたはガードレール的な機能がありますか？

K2Aフレーム™(Knowledge-to-AI Framework™)の紹介

K2Aフレーム™は著者がこの数年会社のAI推進仕事の中で経験してきた課題を個人で考えた問題解決方法論です。このフレームワークに関する用語やプロセス定義などに対して著作権を所有するため、利用したい場合は、本ブログのコメント機能を使ってご連絡ください。

1. K2Aフレーム™の目的

業務知識をAIに変換し、人とAIが協働できる組織文化を作る体系的な方法論。

「AI Agentを作る事」ではなく、「業務知識をAI化し、成果を出すこと」が目的
投資の中心はシステムではなく、人材と知識整備
社員の役割は今までの業務「操作者」ではなく、AIにリプレスされる予定のヒューマンリソースではなく、「AI Pilot（伴走者）」へ進化

1.1 よくある経営陣の誤解パタン

「AIは魔法ーAI Agentがあれば大量コスト削減・外注削減可能」型の誤解
AIは万能ではなく、「限定領域での支援」が適切
期待値と成果の乖離で「PoC疲れ」に落ち、投資継続が止まり、社内外の信頼を失うリスクが高い
「AIで人材シフトー流行りのAIツールで既存正社員を新規事業へシフト可能」型の誤解
「AI運用・評価・改善」など新たな役割が発生
現実は「人員削減」より「リプレイス＋高度化」の組み合わせが有効

1.2 よくある現場の誤解パタン

「データプラットフォームがないからAI活用が無理」
K2Aシナリオカード・手順カードがすでに"データの最小単位"。
つまり「まず業務をカード化すること自体がデータ化の入口」になる。
SharePoint/Notion/Confluence/Google Driveにカードを整理して「人とAIの共用リポジトリ」にする。
これが「疑似データプラットフォーム」になる。
「APIがないからAI Agentが動く環境がない」
Excel・チャット・ワークフローシステムのログ、承認メール――すべてが"半構造化データ"。
APIがなくてもCSVエクスポート、RPAでスクレイピング、フォーム入力のログなど、既存の出口を探す
K2Aを回すうちに「ここは毎回手入力がダルい」→「じゃあ簡単なAPIつけよう」と後追いで必要性が出る。

2. ブランド定義

名称：K2Aフレーム™(Knowledge-to-AI Framework)
タグライン：業務知識をAIへ、人を未来へ / Turning Knowledge into AI, Empowering People

3. K2A循環プロセス™

Capture(業務知識を捕捉) -> Structure(知識を整備) -> PromptOps(プロンプト設計・運用) -> Evals(評価・検証) -> Adopt(業務導入) -> Refine(改善・再登録) -> 再びCaptureへ

4Aモデル（AI Agent Application Architecture）

4Aモデル（AI Agent Application Architecture）は、小生が提唱するLLMベースのAIエージェントアプリケーションを迅速かつ拡張性高く構築するためのリファレンスアーキテクチャです。以下の6つのレイヤーで構成され、エンタープライズ用途に対応可能なセキュリティ・柔軟性・観測性を備えています：

User Interface Layer
Gateway Layer
Orchestrator / Reasoning Layer
MCP Server / Tool Layer
Data / API Layer
Context / Memory Layer

ChatGPT Enterprise SSO Overview

SSO, SCIM, and User Management SSO Overview
SSO は、エンタープライズおよび教育機関向けの顧客のみが利用可能です。

背景のアーキテクチャと用語
現在、ChatGPT および API プラットフォームの両方で、SAML 認証を通じた SSO がサポートされています。
•ワークスペース：ChatGPT のインスタンスを指します。
•組織（Organization）：API プラットフォームのインスタンスを指します。
•アイデンティティプロバイダー（IdP）：デジタル ID を管理するために使用するサービスを指します。当社は、SAML をサポートするすべての IdP との接続をサポートしています。代表的な IdP には以下が含まれます：Okta,Azure Active Directory/Entra ID, Google Workspace

現在、各 ChatGPT ワークスペースには、それに対応するプラットフォーム組織が関連付けられています。
つまり、エンタープライズプラットフォームの「一般」ページにある組織 ID（org-id）は、エンタープライズ ChatGPT ワークスペースに関連付けられている組織 ID（org-id）と同じです。
そのため、ワークスペースと組織は同じ認証レイヤーを共有しています。

ChatGPT Enterprise & Workspace

What is ChatGPT Enterprise?

公式ドキュメントの更新時間は2024年6月のままですので、あまり機能更新していないかもしれません。

ChatGPT Enterpriseとは？

ChatGPT Enterpriseは、企業向けのセキュリティとプライバシーを備えたサブスクリプションプランです。無制限の高速GPT-4oアクセス、長い入力を処理できる拡張コンテキストウィンドウ、高度なデータ分析機能、カスタマイズオプションなど、さまざまな機能を提供します。

自社でChatGPT Enterpriseを利用するには？

ChatGPT Enterpriseを導入したい場合は、営業チームにお問い合わせください。「どの製品やサービスに興味がありますか？」の項目で「ChatGPT Enterprise」を選択してください。

ChatGPT Enterpriseのセキュリティとプライバシー管理について

ChatGPT Enterpriseでは、ビジネスデータをユーザー自身が所有・管理できます。お客様のビジネスデータや会話を学習に使用することはなく、モデルも使用履歴から学習しません。また、ChatGPT EnterpriseはSOC2準拠であり、すべての会話は送信時および保存時に暗号化されます。

さらに、新しい管理コンソールでは、チームメンバーの管理、ドメイン認証、SSO（シングルサインオン）、利用状況のインサイト機能を提供し、エンタープライズ環境での大規模導入を可能にします。

詳しくは、プライバシーページやTrust Portalをご覧ください。追加のご質問がある場合は、営業チームまでお問い合わせください。

ChatGPT Enterpriseのその他の特徴

ChatGPT Enterpriseでは、以下の点が一般ユーザー向けプランと異なります：

• 無制限のGPT-4 Turboアクセス（使用制限なし）

• 高速なパフォーマンス

• 高度なデータ分析機能の無制限利用（旧Code Interpreter）

• 共有可能なチャットテンプレート（企業内のワークフロー構築や共同作業に活用可能）

ChatGPT Enterpriseのサポートを受けるには？

問題が発生した場合は、ヘルプセンターのチャットツールを使ってサポートチームにお問い合わせください。迅速に対応いたします！

メモ：生成AIと開発組織力

コード×AIーソフトウェア開発者のための生成AI実践入門を読んだ感想や今まの業務の中の自分の学びのまとめです。

全体感想

開発組織レベルでAIの最大限活用のため、個人のスキルセットだけではなく、組織全体で生成AIの力を引き出す方法が必要

AIと協調しながら個人が成長し、それから組織の成長に繋がる好循環を生み出す

３つのステップ
１、既存の個人やチームのナレッジを共有して、AIが活用可能な形式に変換する
２、組織のナレッジを透明化し、多くの人がアクセス可能にする
３、共用ナレッジ資産を常に最新状態に維持していく

開発組織として考えられるナレッジ資産

高品質なソフトウェアライブラリ

PJの設計書や運用ドキュメント

再利用可能なソースコードの断片（ロジックやアルゴリズムなど）

開発規約やガイドライン

共通PFのマニュアル及びサンプルコード

設計手法や運用ノウハウ

AI生成時における中間成果物やドキュメント

AIと協働するための技術スタックの内部標準化