万博出展中の次世代脳型AI
10社限定、月額1500円
次のようなメリットがございます。
①リアルタイム・フィードバック
②グリーンAI(低負荷・低負担)
【低負荷】省電力、省半導体
【低負担】省設備、省人件費、省データ、省社会不安
【補足説明】
①リアルタイムで学習し、会話に反映します。
②プログラムとトレーニングのデータを合わせて10GB以下。月額500円以下のレンタルサーバで動作可能。チップ化すれば、中古のスマホ1台で充分動作します。
開発者と経営者を森本が1名で兼任しているため、少数精鋭により、はるかに低い予算で製品化が可能です。
思考回路が明瞭性で、スタンドアロン(オフライン自律性)のため、ユーザー保護を最優先とした製品化によって社会不安を軽減できます。
Sheprd
Sheprdの一般公開用デモ機
Sheprdのデモ機です。クリックしてお試しください。
ver2025-0519-(おすすめ)
2025年5月20日公開。同じく動作の安定性を優先し、
言語処理は外してあります。
・決裁システムのサンドボックスを追加
・エラー自動修復機能を追加
・学習内容公開機能を追加
・トレーニング時に余分な空欄で発生する不具合を解消(2025年5月22日)
ver2025-0403-
2025年4月4日公開。同じく動作の安定性を優先し、
言語処理は外してあります。
・テスト用アカウントあり
・一括学習可能(2025年3月から特許出願中)
ver2025-0221-
2025年2月22日公開。同じく動作の安定性を優先し、
言語処理は外してあります。
・セッション復旧
・一括学習機能追加(ログオンのみ)
・未就学児によるトレーニング結果を追加
「何か教えて」→「えーあい」
・多言語対応追加
「何か教えて」→「ドイツハウス」→「Language」のみ
日本語の他、英語、中国語、ドイツ語、
ポーランド語、ネパール語
・記憶データを分割・統合する処理を追加
・モジュール分割
Sheprdの設計図は未就学児でも紙に書ける作りやすさです。
しかも、ログイン後にその内容を入力してワンプッシュで学習し、
動作に反映できます。
子供向けには、Wi-Fi接続されている玩具やぬいぐるみへの埋め込み、
学習指導を想定しています。
ビジネスでは、提案営業、研修、接客などに有効です。
2025年5月~6月頃から月額1500円のサブスクリプションも予定しています。
万博のオンライン展示も準備中です。
ダウングレード版はAIと呼べる代物ではありません。
しかし、脳型アルゴリズムの一部を使用しております。
非常に低負荷・低負担です。
次世代AIの片鱗は感じて頂けますと幸いです。
(2025年3月に特許取得済です。)
ver2025-0205-
2025年2月5日公開。動作の安定性を最優先したダウングレード版です。
トレーニングが不充分な言語処理を外してあります。
ver2024-0925-
最新ではありませんが開発を止めているので、
比較的、安定しているバージョンです。
確認できていない不具合や故障がございましたら、ご容赦ください。
ログオン機能にご関心がある方は、メールでご連絡ください。
アカウント情報をお送りします。
一度ログインすれば、他のバージョンにアクセスしてもログインした状態で始まります。
Sheprdの特徴
Sheprd(シェパード)は、自然言語処理を解決した小型自律AIです。
統計的な処理を可能な限り排除し、文系的な処理に仕上げました。
LLM(大規模言語モデル)とは比較にならないほどの少量データで、
トレーニングを完了できます。
マシンへの負荷も最小限です。下記の開発環境をご参考ください。
Sheprdのパフォーマンス
入力補助機能でポンポン、コミュニケーション!
①半透明ピンク欄内にある単語や文をクリックすると、
チャット入力欄に自動入力されます。(その時点では送信されません!)
②あとは「送信」ボタンを押すだけでOK!
2024年8月30日以前は具体例を挙げていましたが、
Sheprdに入力補助機能を追加しましたので削除しました。
現在、様々な文章表現への対応や、話題も拡充しています。
入力補助なくしての自由な入力に対応できるのも時間の問題です。
Sheprdの開発背景
2017年2月頃、メールボットの関連技術について特許を取得できました。
全国的にはチャットボットが自然言語処理の問題を抱えていた時期です。
プレゼンして回っても、同業者の関心はメールボットにありません。
その中身となる自然言語処理についてばかり、質問される状況が続きました。
「メールボットを売るためには、自然言語処理を解決する必要があり、
そのためにはAI開発が必要。」
そこで、AIベンチャーへの転向を決意。
幸いにもエンジェル投資家と出会えたことで、
2017年10月、弊社を設立できました。
その後、様々な紆余曲折はございましたが、
2023年7月、上記の目的を達成できる技術は完成しました。
Sheprdの着想
生成AIは時期尚早?
従来のコンピュータによる自然言語処理では、公知の形態素解析エンジンに依拠し、数学的処理によって解決しようとする傾向があります。
しかし、日本語のパターン数は本来、40字程度の一文でも簡単に10の100乗を超えます(注1)。
仮に10年間の秒数が10の8乗だとしても、1秒間に10の92乗を超える処理速度が必要です。
これに対し、2022/05/31の読売新聞(注2)
によると、世界最速のスーパーコンピュータ「フロンティア」は、1秒間に10の18乗程度の処理速度です(注3)。
何年かおきに、数桁加速するような技術革新が起きたとしても、到底、話になりません。
このことは、既存技術による自然言語処理の解決が実質的に不可能であることを表しています。
|
日本語、実は難しくない
ほとんどの日本人は、幼児から日本語を使い始め、小学校入学の前後で自然な会話が可能になります。
文法の教育を受ける児童もいますが、その教育を受けなかったからといって日本語を話せなくなるわけではありません。
これは日本語の教育や理論が必ずしも必要ではないことを示しています。
|
脳こそ実在する理想形
人間の脳は、全身から送られてきた情報を電気信号で受け取り、処理し、命令を電気信号で全身に送っています。
私が知りうる限り、最も効率が良く、性能が高い、情報処理装置です。
そこで、「脳よりも物理的に大きく、電気を浪費し、情報処理能力も劣るような方法では、その時点で失敗と判断すべき。」という厳しい制約を自らに課しました。
この時点で、巷のディープラーニングやビッグデータとは一線を画すコンセプトだったと思います。
仮想空間上だけでも脳を模倣できれば、小型・省力は可能となるはずです。
|
「アレをアレして」も対応可能
会話では、話し手が代名詞を用いたり、省略した表現を用いる場合に、該当する単語を推測する能力が聴き手に求められます。
この能力は、話し手本人から収集したデータに基づかない限り、いくら外部で膨大なデータを収集して分析しても不正確であり、とても非効率です。
ユーザー特有のデータをリアルタイムで蓄積・反映する必要があります。
これができれば、オジサンの「アレはアレだから、アレをアレしてさぁ~」というトークにもついていけるようになります。
|
環境破壊と海外依存の問題
近年の生成AIをめぐる開発競争では、電力や半導体を浪費することが当たり前となり、環境に悪い展開が激化しています。
また、この分野では、TPU(Tensor Processing Unit;Google社)、
半導体生産拠点、AWS(Amazon Web Service;Amazon.com社)などの技術的土台を、
すでに韓国・台湾・ビッグテック(FAANG、国内ではGAFA)に掌握されつつあります。
これらの影響を脱却しなければ、日本はいつまで経ってもデジタル植民地のままです。
長引く国際競争力の低迷を根本から解決する必要があります。
|
本当の「自然」とは?
例えば、何らかの原因でロボットに火がついているとします。
そんなロボットに対して「今晩のおすすめは何?」と質問し、「カレーですね。」と答えられる状況は「自然」でしょうか?
そこはきっと「熱い!ヤバイ!早く消して!消して!!」と懇願するのが「自然」です。
言語処理は確かに複雑です。
しかし、「自然」言語処理を目指すのであれば、さらなる複雑さを積極的に受け入れる姿勢が必要不可欠です。
|
自然言語処理の市場性
昔、ユーザーによるシステムの利用方法は、手順が決められていました。
その手順に柔軟性を与えようとすると、数十万~数百万の追加予算で新しい手順を用意する必要がありました。
さらに、新しい手順は、同一のシステムに追加される場合もあれば、他社製品で実現されることもありました。
ユーザーに選択の自由は与えられたかもしれませんが、提供する側は熾烈な競争に晒され続けていました。
しかし、自然言語処理を装備したシステムならば、はるかに低予算でユーザーの操作に自由度を与えられる一方、他社製品への流出も防止できます。
生成AIブームがその可能性を市場に示した事実は、否定できません。
|
(注1)日本最大の『日本国語大辞典』(小学館)によると、単語の数は50万語です。
例えば「AはBのCです。」で、A・B・Cのそれぞれに10万語の候補があった場合、「10万語の3乗≒10の15乗」となります。
この桁になると、単語数の増減よりもA・B・Cなどの候補数が大きな影響を与えます。
40字程度の文となると、相当なパターンです。
(注2)スパコン世界ランク、「富岳」2位に陥落…首位は毎秒100京回を突破の米国最新鋭機
(注3)プロセッサの違いなどは度外視しています
※ 2024年7月19日提出の出願書類から抜粋しています。
|
Sheprdの進捗(開発)
2024年7月22日からデモ機を公開開始。
2025年2月5日から「ダウングレード版Sheprd」を公開。
Sheprdの開発環境
【OSバージョン】FreeBSD 13.0-RELEASE-p12 amd64
【CPU】Intel Xeon Processor (Cascadelake)
【Webサーバ】Apache/2.4.54
【使用したperlのライブラリ】utf8、CGI、Jcode、Encode、Encode 'from_to'、Cwd 'getcwd'、CGI::Cookie、CGI::Session、File::Copy、Fcntl qw/:DEFAULT :flock :seek/、Time::Local
【外部DB連携】ナシ
【その他外部連携】ナシ
【出典】さくらのレンタルサーバ スタンダード(月額425円)