|
2025/10/27 画像一括追加と動的演出
2025/10/23 レポート機能
2025/10/22 Lineからの画像追加
2025/10/15 リンクとサブページの同時追加
2025/10/10 ショートカットと複数行
|
2025/10/09 ボットへの変身
2025/10/06 重文への対応
2025/09/29 人間関係確認
2025/09/24 単文4連投
|
|
生成AIは時期尚早? 従来のコンピュータによる自然言語処理では、公知の形態素解析エンジンに依拠し、数学的処理によって解決しようとする傾向があります。 しかし、日本語のパターン数は本来、40字程度の一文でも簡単に10の100乗を超えます(注1)。 仮に10年間の秒数が10の8乗だとしても、1秒間に10の92乗を超える処理速度が必要です。 これに対し、2022/05/31の読売新聞(注2) によると、世界最速のスーパーコンピュータ「フロンティア」は、1秒間に10の18乗程度の処理速度です(注3)。 何年かおきに、数桁加速するような技術革新が起きたとしても、到底、話になりません。 このことは、既存技術による自然言語処理の解決が実質的に不可能であることを表しています。 |
日本語、実は難しくない ほとんどの日本人は、幼児から日本語を使い始め、小学校入学の前後で自然な会話が可能になります。 文法の教育を受ける児童もいますが、その教育を受けなかったからといって日本語を話せなくなるわけではありません。 これは日本語の教育や理論が必ずしも必要ではないことを示しています。 |
脳こそ実在する理想形 人間の脳は、全身から送られてきた情報を電気信号で受け取り、処理し、命令を電気信号で全身に送っています。 私が知りうる限り、最も効率が良く、性能が高い、情報処理装置です。 そこで、「脳よりも物理的に大きく、電気を浪費し、情報処理能力も劣るような方法では、その時点で失敗と判断すべき。」という厳しい制約を自らに課しました。 この時点で、巷のディープラーニングやビッグデータとは一線を画すコンセプトだったと思います。 仮想空間上だけでも脳を模倣できれば、小型・省力は可能となるはずです。 |
「アレをアレして」も対応可能 会話では、話し手が代名詞を用いたり、省略した表現を用いる場合に、該当する単語を推測する能力が聴き手に求められます。 この能力は、話し手本人から収集したデータに基づかない限り、いくら外部で膨大なデータを収集して分析しても不正確であり、とても非効率です。 ユーザー特有のデータをリアルタイムで蓄積・反映する必要があります。 これができれば、オジサンの「アレはアレだから、アレをアレしてさぁ~」というトークにもついていけるようになります。 |
||||||
|
環境破壊と海外依存の問題 近年の生成AIをめぐる開発競争では、電力や半導体を浪費することが当たり前となり、環境に悪い展開が激化しています。 また、この分野では、TPU(Tensor Processing Unit;Google社)、 半導体生産拠点、AWS(Amazon Web Service;Amazon.com社)などの技術的土台を、 すでに韓国・台湾・ビッグテック(FAANG、国内ではGAFA)に掌握されつつあります。 これらの影響を脱却しなければ、日本はいつまで経ってもデジタル植民地のままです。 長引く国際競争力の低迷を根本から解決する必要があります。 |
本当の「自然」とは? 例えば、何らかの原因でロボットに火がついているとします。 そんなロボットに対して「今晩のおすすめは何?」と質問し、「カレーですね。」と答えられる状況は「自然」でしょうか? そこはきっと「熱い!ヤバイ!早く消して!消して!!」と懇願するのが「自然」です。 言語処理は確かに複雑です。 しかし、「自然」言語処理を目指すのであれば、さらなる複雑さを積極的に受け入れる姿勢が必要不可欠です。 |
自然言語処理の市場性 昔、ユーザーによるシステムの利用方法は、手順が決められていました。 その手順に柔軟性を与えようとすると、数十万~数百万の追加予算で新しい手順を用意する必要がありました。 さらに、新しい手順は、同一のシステムに追加される場合もあれば、他社製品で実現されることもありました。 ユーザーに選択の自由は与えられたかもしれませんが、提供する側は熾烈な競争に晒され続けていました。 しかし、自然言語処理を装備したシステムならば、はるかに低予算でユーザーの操作に自由度を与えられる一方、他社製品への流出も防止できます。 生成AIブームがその可能性を市場に示した事実は、否定できません。 |
|||||||
|
(注1)日本最大の『日本国語大辞典』(小学館)によると、単語の数は50万語です。 例えば「AはBのCです。」で、A・B・Cのそれぞれに10万語の候補があった場合、「10万語の3乗≒10の15乗」となります。 この桁になると、単語数の増減よりもA・B・Cなどの候補数が大きな影響を与えます。 40字程度の文となると、相当なパターンです。 (注2)スパコン世界ランク、「富岳」2位に陥落…首位は毎秒100京回を突破の米国最新鋭機 (注3)プロセッサの違いなどは度外視しています ※ 2024年7月19日提出の出願書類から抜粋しています。 |
|||||||||
