「今週のSaaSxAIニュース」ピックアップ!

デジタルワーカーをいかに創るか?:AIエージェント構築の重要ポイント
Alfredo Soneの Medium「AI Agents: How to build Digital Workers」の一部を日本語で紹介したものです。全文はリンク先をご覧ください。
Mediumで話題となったAIエージェント構築のポイントをまとめた記事。AIエージェントは、日本でも労働力不足を背景に、今後のソフトウェア業界の潜在能力を一気に拡大させる大きな可能性を秘めています。この記事では、AIエージェントの構成要素や構築・運用における重要なポイントをまとめています。
- AIエージェントは、単なるプログラミングを超えて、コンピューターに「考え方」を教える新しいソフトウェア開発のアプローチです。従来の固定的な指示に従うプログラムとは異なり、推論、意思決定、行動を自律的に行います。
- エージェントの主要な構成要素は「知覚」(入力の処理)、「脳」(LLMによる推論と計画)、「メモリ」(短期・長期記憶)、「知識」(データベース)、「アクション」(ツールやAPIの使用)です。
- AIエージェントの設計は、新しい従業員の採用・育成に似ています。明確な役割、責任、目標を定義し、必要なツールと知識を提供する必要があります。
- エージェントの設計プロセスには、ペルソナと目標の定義、タスクとプランの概要作成、メモリの定義、知識の装備、ツールの提供という段階があります。
- 複雑な問題に対しては、単一の万能エージェントではなく、専門化された複数のエージェントチームで対応する方が効果的です。各エージェントが特定の役割を担当し、協力して作業を行います。
- エージェントの開発は反復的なプロセスです。実際の使用環境で発見されるエッジケースや想定外の状況に対応するため、継続的な改善が必要です。
- セキュリティは基本的な要件であり、SSO、ロールベースの権限管理、資格情報の管理など、適切な保護措置が必要です。
- 運用面では、エージェントのパフォーマンス追跡、監査、信頼性の確保が重要です。
- 短期メモリはセッションベースでLLMのコンテキストウィンドウに依存し、長期メモリは外部データベースに保存され、過去の対話や設定を参照できます。
- AIエージェントは単なる自動化ツールではなく、デジタルコラボレーターとして機能し、テクノロジーの構築方法に大きな変革をもたらしています。
AIエージェントの過剰な期待への批判論
Austin Starksの Medium「You are an absolute moron for believing in the hype of “AI Agents”.」の一部を日本語で紹介したものです。全文はリンク先をご覧ください。
昨今のAIエージェントに対しての過剰な期待や宣伝に対して懐疑的な意見をまとめた、こちらもMediumで反響を呼んだ記事。筆者はCMUでAIを学び、GPT-3時代から深くLLMとかかわってきた経験を持つエンジニアです。この筆者は、AIエージェントに関して「AIには確かに有用だが、現状ではAIエージェントが企業の重要な業務プロセスを置き換えることは非現実的だ」と結論付けています。ある意味、現状のAIエージェントが乗り越えなければいけない課題や、このような問題が起こりにくいアプリケーションの開発が重要になるとも言えるので、非常に参考になります。
- 小規模モデルの限界
小規模なモデルは実用的なエージェントタスクを処理するには能力が不十分で、より高性能なモデルは非常にコストがかかります。 - エラーの連鎖的な影響
エラーの連鎖的な影響が大きな問題です。例えば、各サブタスクの成功率が90%だとしても、4つのサブタスクを経ると最終的な成功率は66%まで低下します。 - 高コストな高性能モデル
高性能なモデル(例:GPT-4)を使用すると精度は向上しますが、コストが急激に上昇し、実用的ではなくなります。エージェントの出力を検証するためにも強力なLLMが必要で、これによりコストがさらに増加します。 - 非決定論で予測不可能
コードベースの決定論的なシステムと比べ、LLMベースのエージェントは非決定論的で予測不可能な結果をもたらす可能性があります。 - LLMプロバイダーへの依存性の高さ
OpenAIなど特定のプロバイダーへの依存度が高くなり、プロバイダーの変更も容易ではありません。

AIの進展と2025年の予測
No Priors: AI, Machine Learning, Tech, & Startups「No Priors Ep. 100 | With Sarah and Elad」を日本語で紹介したものです。全内容はリンク先をご覧ください。
北米を代表するAI投資家であるSarah GuoとElad Gilが、DeepSeekの影響力、OpenAIの新たな取り組み、そして2025年の予測に焦点を当てながら、AIにおける重要な進展について議論を展開し、市場動向やテクノロジーの進歩、そして変化し続けるAI業界の状況について詳しく探っています。以下が主要なポイントです。
- Deep Seekの市場影響力とコスト分析
中国発の最先端AIモデル「DeepSeek」は、推論能力などの分野で卓越した性能を示しました。最終モデルの実行コストは500万から1,000万ドルと公表されましたが、専門家らは完成版に至るまでに数億ドル規模の計算コストが投じられたと分析しています。この報告された低コストは、NVIDIAの株価20%下落などの市場反応を引き起こしましたが、AI開発の総コストを考慮すると、この市場の反応はやや過剰だったとされています。 - AIモデルトレーニングにおける劇的なコスト削減AI
モデルのトレーニングと推論コストは著しい低下を示しています。過去18ヶ月間で、GPT-4レベルのモデルにおけるトークンあたりのコストは180分の1にまで減少しました。この大幅なコスト削減は、実験やデータ処理、その他の関連コストを考慮しても、AI開発の敷居が大きく下がっていることを示唆しています。 - モデルパフォーマンスの収束
分析によると、AIモデルは推論、知識、コーディング、多言語対応など、様々な評価基準においてパフォーマンスの差が縮まってきています。18ヶ月前と比較すると、各プロバイダー間の性能差は大幅に縮小しましたが、一部の分野では依然としてリーダー企業と後発企業の間に明確な差が存在しています。 - OpenAIのDeep Researchによるイノベーション
Deep Researchは、これまでアナリストやインターンが担当していた知識労働の自動化において、大きな進歩を示しています。その効果は分野によって異なり、専門的な知識が必要な分野よりも、調査研究や包括的な見解の生成において特に優れた性能を発揮しています。 - インフラ投資とスケーリング
AIインフラへの大規模投資を含むStargate Projectは、AI開発におけるスケーリングの重要性を明確に示しています。アルゴリズムの効率化によってスケーリングの一部の利点が相殺される可能性はありますが、大規模な計算処理能力へのアクセスは、高度なAI機能を追求する組織にとって依然として不可欠です。 - ファンデーションモデル市場の統合
2025年には、特に画像生成、動画、音声などの周辺分野でファンデーションモデル市場の部分的な統合が予想されています。この統合の波は二次的な言語モデルにも及ぶ可能性がある一方で、物理学、生物学、材料科学などの新たな競争分野が出現すると見られています。 - バーティカルAIアプリケーションの成長
法務(Harvey)、カスタマーサクセス(Decagon)、医療記録など、様々な専門分野でAIアプリケーションが急速に拡大すると予想されています。これらの専門特化型アプリケーションは、より自律的なAIシステムへの移行を示す形で、エージェント機能を段階的に実装していくことが見込まれます。 - コンシューマーAIの進化
スタートアップと既存企業の双方が新たな取り組みを開始する中で、コンシューマー向けAIアプリケーションの大規模な実験が予想されています。これはコンシューマー向けAI開発の新たな波を示唆していますが、市場の完全な成熟にはまだ時間を要する可能性があります。 - モデル性能の向上
より高性能で応答速度の速いモデルの開発により、コンシューマー向けアプリケーションの可能性が大きく広がると予想されています。エッジコンピューティングの実装とWebベースのアプリケーション、両面での改善により、一般ユーザーにとってAIがより身近なものとなっていきます。 - ロボティクスにおける技術的ブレークスルー
2025年には、ロボティクスと汎用化において画期的な技術実証が見られる可能性があります。ただし、その広範な実用化にはより長期的な時間軸が必要となるでしょう。これらの進歩により、物理的な世界との相互作用や適応学習において、新たな可能性が切り開かれることが期待されます。 - 推論モデルの進化
AI推論能力の向上は、信頼性とタスクの複雑性の両面で進展が見込まれています。この分野における急速な技術進歩により、これまで実現が困難だったアプローチが、新たな技術の登場とともに実用化される可能性が出てきています。 - ドメイン特化型データ生成
生物学や材料科学などの専門分野において、より効率的なデータ生成戦略への注目が高まっています。これには、より効果的なトレーニングデータを作成するため、専門分野の知見とAIの理解を組み合わせるアプローチが含まれます。 - AIコンテンツ創造の未来
AIエージェントがコンテンツ創造の主要な担い手となる可能性が示唆されていますが、これは、情報の生成と共有方法における大きな変革を予見するものであり、AIの自律性と創造的タスクにおける能力向上への期待を反映しています。
[海外]
バーティカル
- XOi - フィールドサービスエンジニアが写真で修理中の機械に関する情報に素早くアクセスできるSaaS。KKRから$230Mを調達。今回の調達資金でSpecifx社を買収(TechCrunch)
- Lula - 配管工、電気技師、HVAC請負業者を含む6,000人以上のネットワークを持ち、不動産事業者に効率的で信頼性の高いメンテナンスを提供するAI×SaaS。シリーズAで$28Mを調達。投資家はPeakSpan Capital 、RET Venturesなど(Yahoo! Finance)
- Protex AI - 最先端のコンピューター・ビジョンとAI技術で現場の労働安全を支援するAI。シリーズBで$36Mを調達。投資家はHedosophia、Salesforce Venturesなど(ISHN)
- Qount - 公認会計事務所向けの業務管理AI。Savant Growth、Kennet Partnersなどから$17Mを調達(FinSMEs)
- Presto - UBERや大手レンタカー会社と提携するEV充電オールインワンSaaS。シードで$15Mを調達。投資家はUSV、Congrant Venturesなど(Yahoo! Finance)
- GenLogs - センサー、商用データ、オープンソースデータセットの全国ネットワークを通じて独自の貨物インテリジェンスプラットフォーム。シリーズAで$14.6Mを調達。投資家はVenrock、HOF Capitalなど(FinSMEs)
- Qeen.ai - Google/DeepMind出身者がドバイに設立した、ECビジネス特化AIエージェント。シリーズで$10Mを調達。投資家はProsus Venturesなど(TechCrunch)
エンタープライズ
- Nextworld - 製造業、流通業、ソフトウェア業などのエンタープライズ向けに既存のERPシステムとシームレスに統合し、ERPの機能拡張を支援するSaaS。シリーズFで$65Mを調達。投資家はMcVaney Investment Partnershipなど(Yahoo! Finance)
- TrueFoundry - AIアプリケーションをシームレス、セキュア、かつコスト効率よく展開、管理、拡張を支援するAI導入支援SaaS。シリーズAで$19Mを調達。投資家はPeakXV、Intel Capitalなど(Yahoo! Finance)
- Cognida.ai - エンタープライズのAI実験導入から測定可能なビジネスインパクトを予測するAI。シリーズAで$15Mを調達。投資家はNexus Venture Partnersなど(Venture Beat)
- fileAI - シンガポール発のエンタープライズの非構造データ処理を自動化支援するAI。Illuminate Financial、Antler Elevateなどから$14Mを調達(Fintech Global)
- Tana - ユーザーが生成したデータとそれに続くアクション・アイテムの作成と自動化を支援するナレッジグラフAI。シリーズAで$14Mを調達。投資家はTola Capital、Lightspeed Venture Partnersなど(TechCrunch)
フィンテック
- Solaris - ドイツ発のBanking as a Service大手。SBIグループが過半数のシェアを獲得して、シリーズGで€140Mを調達(Fintech Global)
- Jump - ファイナンシャル・アドバイザーおよびその他の金融サービス・プロバイダー向けAI。Battery Ventures、Citi Venturesなどから$20Mを調達(Yahoo! Finance)
- Fimple - トルコ発の柔軟でコンポーザブルなクラウドネイティブのコアバンキングSaaSソリューション。シリーズAで$12Mを調達。投資家はDN Capital、Smartfinなど(Fintech Global)
サイバーセキュリティ
- Semgrep - 開発サイクルのスピードを妨げることなく複雑なコードベースのセキュリティを確保するコードセキュリティAI。シリーズDで$100Mを調達。投資家はMenlo Ventures、Felicisなど(Fintech Global)
- 7AI - サイバーセキュリティ特化のAIエージェント。シードで$36Mを調達。投資家はGreylock、Spark Capitalなど(Fintech Global)
- Riot - サイバーセキュリティリスクの従業員教育を起点に、従業員へのサイバーアタックの範囲を再証言するサイバーセキュリティSaaS。シリーズBで$30Mを調達。投資家はLeft Lane Capital、YCなど(TechCrunch)
ヘルスケア
- Avelios - SAPのレガシーシステムを使用する医療機関向けのヘルスケアAI。シリーズAで€30Mを調達。投資家はSequoia Capital、Reventなど(TechCrunch)
- Lynx - 医療費の支払いと管理を簡素化するヘルスケア特化Fintech x SaaS。シリーズAで$27Mを調達。投資家はFlare Capital Partners、CVS Health Venturesなど(Yahoo! Finance)
リーガルテック
- Ivo - 契約書レビュー時間を75%削減するリーガルアシスタントAI。シリーズAで$16Mを調達。投資家はCostanoa Ventures、Fika Venturesなど(Yahoo! Finance)
その他
- Atombeam - 「Data-as-Codewords」と名付けたデータ転送技術を開発するファイル送信高速化技術・データセキュリティ。シリーズで$20Mを調達。投資家は6,500人以上の個人投資家(Silicon Angle)
[国内]
- レンズ - 統合的な委託先・サードパーティ管理を実現するため、ワークフロー、台帳管理、チェックシート、グループアセスメント、セキュリティなどの機能を提供。Coral Capitalをリード投資家としてCoreline Ventures、DG Daiwa Ventures、マキナレコードから8.44億円を調達(PR Times)
- ukka - 食品開発・製造プラットフォーム「FOOVEST」を運営。東芝テック、CARTA VENTURES、千葉道場ファンドからシリーズAで3.2億円を調達(PR Times)
- ハイヤールー - エンジニア組織向けプラットフォームを提供。シリーズAでエクイティ・デットで合計3.13億円を調達。投資家はディープコア、SMBCベンチャーキャピタル他、既存投資家(PR Times)
- AIBTRUST - WEB3.0技術を活用した医療情報流通スマートコントラクトシステムの開発。シードで総額3億円を調達。投資家は大阪大学ベンチャーキャピタル(PR Times)
- ラクビル - 事業用不動産の対テナント業務効率化・高度化プラットフォーム「ラクビルTeX」を運営。プレシリーズAで1.7億円を調達。投資家はアニマルスピリッツ他(PR Times)
- リスポ - EC向け積立決済SaaS「Respo(リスポ)」を提供。プレシリーズA 1stクローズで1.2億円を調達。投資家はmint、サイバーエージェント・キャピタル、East Ventures、佐藤裕介氏など(PR Times)
- Zaimo - 経営管理AIエージェントを提供。シードで約1億円を調達。投資家はデライト・ベンチャーズ、DEEPCORE、千葉道場ファンド、East Ventures、エンジェル投資家(PR Times)
- CareMaker - 訪問看護ステーション業界に特化したSaaS「CareMaker」を開発・提供。QXLV、大和ハウスグループグロースファンドから1億円を調達(PR Times)
- アガティカ - 医療機関向けのキャッシュレス決済アプリ「玉円(ぎょくえん)ペイ」を提供。シードで4,580万円を調達。投資家はQXLV、個人投資家複数名(PR Times)
- hootfolio - 因果分析による科学的な意思決定ソリューション「causal analysis︎®」を提供。クオンタムリープベンチャーズ、ユナイテッドから資金調達を実施(PR Times)