https://www.cell.com/cell/fulltext/S0092-8674(25)00681-6?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0092867425006816%3Fshowall%3Dtrue
運動皮質における内面音声と音声神経プロテーゼへの影響
ハイライト
•
試行、内面、知覚されたスピーチは、運動皮質で共通の表現を持っています
•
内部音声BCIは、ユーザーエクスペリエンスを向上させた一般的な文章をデコードします
•
プライベートな内なるスピーチの側面は、カウントなどの認知タスク中に解読できます
•
忠実度の高いソリューションは、音声BCIがプライベートな内なる音声を解読するのを防ぐことができます
要約
スピーチ脳とコンピュータのインターフェース(BCI)は、麻痺した人々とのコミュニケーションを回復する可能性を示していますが、プライベートな内なるスピーチを解読する可能性についての議論を促しています。それとは別に、内なるスピーチは、スピーチBCIユーザーにスピーチを物理的に試みるように要求する現在のアプローチを回避する方法である可能性があります。これは疲れるし、コミュニケーションが遅くなる可能性があります。4人の参加者のマルチユニット録音を使用して、内なるスピーチは運動皮質で強力に表現され、想像上の文章をリアルタイムで解読できることがわかりました。内なるスピーチの表現は、スピーチの試みと非常に相関していましたが、両者を区別する神経の「運動意図」次元も特定しました。プライベートな内面音声を解読する可能性を調査し、シーケンスリコールとカウントタスク中に、フリーフォーム内面音声のいくつかの側面を解読できることがわかりました。最後に、音声BCIが意図せずにプライベートな内なる音声を解読するのを防ぐハイファイ戦略を示します。
グラフィック抽象
キーワード
はじめに
音声BCIの翻訳にも現実的な課題が残っています。現在のシステムでは、ユーザーは自分の能力を最大限に発揮して音声を生成しようとする必要があります(「試行」)、これは疲れる可能性があり、麻痺したユーザーには固有の速度制限があります。ユーザーが運動出力を試みずに話すことを想像する内なる音声を解読するBCIは、そのような問題に対処することができます。
ここでは、運動皮質に配置されたマイクロ電極配列を持つ4人のBrainGate2参加者の内面音声の神経表現を研究しました。私たちは、内なるスピーチが堅牢に表現されていることを発見し、大きな語彙(125,000語)から自己ペースの想像文を解読できる概念実証のリアルタイム内なるスピーチBCIを実証しました。また、参加者が内面的なスピーチを使用するように明示的に指示されていないタスク中でも、自由形式の内面的なスピーチの側面を解読できることがわかりました。その神経幾何学を特徴づけることで、神経の「運動意図」次元の助けを借りて2つを区別することができるが、内なるスピーチは、試みスピーチのより弱い変調版であるように見えることがわかりました。したがって、スピーチBCIは、内なるスピーチを高精度に無視するように訓練できることがわかりました。また、内部音声BCI使用中の意図しない出力を防ぐために、内部で話されている「キーワード」を高精度に検出できるシステムも実演し、ユーザーがシステムを「ロック」および「ロック解除」できるようにします。
議論
運動皮質における内言語表現
皮質内音声BCIへの影響
内なるスピーチは、これまでスピーチの試みだけに頼っていたスピーチBCIを改善する方法にもなります。この作業では、重度の発話障害を持つ3人のリアルタイムの内発話BCIを実証しました。スピーチの試みと比較して、内話BCIはより少ない労力を必要とし、改善された快適さを提供し、麻痺した人のスピーチの試みを遅らせる生理学的制約(呼吸制御など)を迂回し、スピーチBCIが通常のスピーチに匹敵する速度を達成するための前進を可能にする可能性があります。しかし、内部音声BCIは、内部思考がBCI出力に誤って「漏れる」のを防ぐために、追加の設計上の考慮事項が必要になる場合があります。ユーザーが意図した場合にのみデコードのロックを解除し、高い精度を達成するための簡単なキーワードメカニズムを使用することで、この問題に対処しました。
特に、私たちはまた、眼外運動のみで、音声アーティキュレーター制御(T17)のない無関節症の人の試みと内面のスピーチも評価しました。どちらの条件も観察可能な動きを生み出さなかったが、試されたスピーチはより強く表現され、無関節症でも運動皮質で明確にする意志が維持されていることを示している。これは、ほぼまたは完全にロックインしている個人のスピーチBCIを駆動する有用な行動であり続ける可能性があることを示唆しています。
研究の限界
運動皮質における神経活動は、4人の参加者で同様の試みと様々な内言語行動をコードすることを実証しましたが、これらの発見が限られたサンプルサイズと認知タスクのための内面音声の個人の関与の潜在的な変動のために、他の人に一般化するかどうかは不明です。スピーチBCIを使用する個人の精神的なプライバシーを確保するためにここに示されている戦略は、最初の調査です。スピーチBCIがより広く使用されるようになるにつれて、追加の対策が必要になるかもしれません。最後に、私たちは、指導された内なるスピーチは、26%から54%のWERを持つ大きな語彙を使用して解読できること、そして自由形式の内なるスピーチのいくつかの側面は、シーケンスリコール、カウント、および促された思考タスクで解読できることを示しました。しかし、自由形式の思考では、完全でわかりやすい文章を正確に解読することは不可能でした。録音技術が向上するにつれて、そうすることは可能かもしれませんが、まだ実証されていません。
リソースの可用性
リードコンタクト
材料の入手可能性
この研究は新しい試薬を生成しなかった。
データとコードの可用性
•
•
•
謝辞
参加者のT12、T15、T16、T17、およびそのケアパートナーが、この研究に惜しみなく時間をかけ、貢献してくれたことに感謝します。また、Bからの管理上のサポートにも感謝しています。デイビス、K.ツオウ、S。コサシ、M。マスッド、B。トラバース、そしてD。ロスラー、そして臨床現場の監督のためのスティーブ・マーノフ。この研究は、国防保健局補佐官房からのALSパイロット臨床試験賞(AL220043)、国立難病およびその他のコミュニケーション障害研究所が管理する国立衛生研究所からのニューイノベーター賞(NIH 1DP2DC021055)、グローバルブレインのためのサイモンズコラボレーションからの助成金(872146SPI)、A.P.からのポスドクフェローシップによってサポートされました。ジャンニーニ財団; 退役軍人省研究開発局からの支援 (nos.N2864C、A2295R、およびA4820R)、Wu Tsai Neurosciences Institute、Howard Hughes Medical Institute、Larry and Pamela Garlick、Simons Foundation Collaboration on the Global Brain and NIDCD(nos.U01-DC017844、U01-DC019430、およびK23-DC021297)、Ketterer-Vorwald Neurosciences Interdisciplinary Graduate Fellowship、National Institute of Neurological Disorders and Strokes(NIH DP2NS127291)、Eunice Kennedy Shrver National Institute of Child Health and Human Developmentのポスドクフェローシップ、Blavatnik Family Foundationの大学院生フェローシップ、NSF GRFP。内容は、退役軍人省や米国政府の見解を表すものではありません。注意:調査用デバイス。連邦法により調査用途に制限されています。
著者の貢献
概念化、E.M.K.およびB.A.K.;方法論、E.M.K.、B.A.K.、およびF.R.W.;ソフトウェア、D.A.、S.R.N.N.-T.S.C.、N.、N.H.Y.、B.、B.J.M.K.、およびB.A.K.; 形式分析、B.A.K.、およびF.R.W.; 調査、E.M.M.K.、F.K.、F.N.R.N.C.C.、B.、B.J.J.、P.、N.、N.、および編集、および編集、D.、D.、D.、D.、D.、D.、D.、D.、D.W. 、、
利益の宣言
MGH翻訳研究センターは、Axoft、Neuralink、Neurobionics、Paradromics、Precision Neuro、Synchron、およびReach Neuroと臨床研究支援契約(CRSA)を結んでおり、L.R.H.はコンサルティングインプットを提供しています。L.R.H.は、非営利の支援通信デバイス技術財団(Speak Your Mind Foundation)の理事会の非報酬メンバーです。マス・ジェネラル・ブリガム(MGB)は、インプラント可能な脳とコンピュータのインターフェース・コラボレーション・コミュニティ(iBCI-CC)を招集しています。Paradromics、Synchron、Precision Neuro、Neuralink、Blackrock Neurotechからこれまでに受け取ったものを含む、MGBへの慈善寄付契約は、L.R.H.が努力するiBCI-CCをサポートしています。
S.D.S.は、スタンフォード大学からBlackrock NeurotechとNeuralink Corp.にライセンスされた知的財産の発明者です。彼はソネラの顧問です。彼はまた、Wispr.aiに株式を持っています。C.P.はMeta(Reality Labs)の従業員です。D.M.B.はParadromics Inc.の外科コンサルタントです。D.M.B.とD.B.R.は、Paradromics Inc.の臨床製品に対するConnexus BCI臨床試験の主任研究者です。S.D.S.とD.M.B.は、カリフォルニア大学デイビス校が所有する音声神経プロテーゼに関連する知的財産の発明者であり、ニューロテクノロジーのスタートアップにライセンスを取得しています。
J.M.H.はParadromicsのコンサルタントであり、Enspire DBSの医療諮問委員会に所属し、Maplight Therapeuticsの株主です。彼はRe-EmergeDBSの共同創設者でもあります。彼はまた、スタンフォード大学からブラックロック・ニューロテックとニューラリンク社にライセンスされた知的財産の発明家でもあります。F.R.W.は、スタンフォード大学がBlackrock NeurotechとNeuralink Corp.にライセンスした知的財産の発明家です。
ジェネレーティブAIとAI支援技術の宣言
ChatGPT、o1、o3-mini、およびGitHub CoPilotは、いくつかの図のプロットコードの生成と、コードの文書化の支援に使用されました。LLMで生成されたすべてのコードは、研究者によって検証されました。
STAR★メソッド
実験モデルと研究参加者の詳細
研究の調査的性質を考えると、サンプルサイズの考慮事項は行われませんでした。しかし、私たちは参加者間で調査結果を再現することに分析に焦点を当てています。研究の主な包含基準は、参加者の臨床歴と侵襲的な神経インプラントの一致でした。私たちはたまたま性別ごとに2人の参加者を登録しましたが、この研究では、社会経済的地位、人種、民族、性別、またはこれらの要因の組み合わせは制御されませんでした。
方法の詳細
機能的なMRI音声横方向化と配列配置
神経信号処理
データ収集装置
「内面音声、知覚音声、および無音読解は、腹側および中央前回で表される」方法
刺激ワードの選択
孤立した口頭行動指示-遅延タスク
ナイスベベイズの分類
アーティキュレーションチューニングの持続時間のコントロール
「運動皮質における音声の試行の縮小版としての内面音声と認識音声」の方法
相互検証された相関関係評価指標
相互検証された推定器を使用する動機は、相関のサンプル推定値がゼロに偏っていることです。これを見るために、
正規化された神経距離
主要コンポーネント分析の視覚化
「自己ペースの内面的なスピーチのリアルタイムデコード」の方法
セッションデザイン
参加者の内なるスピーチ行動戦略
語彙と文章の選択
リアルタイムのデコーダートレーニングデータ
RNN
言語モデル
ワードエラー率
単語エラー率(WER)を使用してデコード性能を評価しました。これは、デコードされた単語シーケンスとターゲットプロンプト文の間の編集距離として定義されます。つまり、シーケンスを正確に一致させるために必要な挿入、削除、および置換の数です。エラーの合計数が元のプロンプトの単語数を超えると、WER は 100% を超えることができます。
報告されたすべてのエラー率は、多くの独立した文で計算された集合的なWERです。これを計算するために、すべての文のエラーの合計数を合計し、対応する参照文の単語の合計数で割った。この方法は、文レベルの平均に不均衡な影響を与える可能性のある非常に短い文の過重を避けることができます。WERの信頼区間は、個々の試験でのブートストラップ再サンプリングを使用して推定され、10,000の再サンプリングされたデータセットにわたって集計WERを再計算しました。
偶然のパフォーマンスを推定するために、デコーダ出力に関してグランドトゥルースラベルをランダムに順列させ、デコーダ出力が正しいターゲット文に対応しなくなったようにしました。合計 WER は、各シャッフルセット (10,000 回) のすべての評価文にわたって計算されました。チャンスレベルは、このシャッフル分布からのブートストラップされた95%信頼区間の下限として定義されました。偶然のパフォーマンスを推定するこの方法は、デコーダの出力とターゲット文の間に有意な関係が存在するかどうかをテストするだけで、最適な推測によって達成できるパフォーマンスよりも悪い100%ワードエラー率を超えるチャンスレベルをもたらす可能性があることに注意してください(たとえば、何も出力しない)。これは、シャッフルはデコーダーの出力がターゲットに関連しているかどうかのみを評価するためです。たとえば、デコーダーが正しい文章を5回繰り返し出力した場合、単語のエラー率は400%になります(出力がターゲットと一致するためには、余分な単語をすべて削除する必要があるため)、チャンスレベルはさらに高くなります(シャッフルでは、繰り返される単語だけでなく、ほぼすべての単語を削除または変更する必要があるため)。
「連続リコールタスクによって誘発された指示されていない内面のスピーチは、i6vから解読できる」の方法
精神戦略の指示のない上肢運動タスク
指導された精神戦略による上肢運動タスク
類似の音声シーケンスのリコールタスクを試みた
手の動きの追跡
ジョイスティックの動き(3要素矢印、単一要素矢印)を必要とするタスクでは、T12の手の動きはLogitech Extreme 3D Proゲーミングジョイスティックを使用して記録されました。描画タスク(3要素線、内面スピーチ、内面音声なし)の場合、T12は15インチLCDライティングタブレット(ERUW Shenzhen Lei Rui Technology Co.、Ltd)にスタイラスを使用して描画するように指示されました。ブロック間の線が消去されました。開始位置は、各ブロックの前にタブレットにXを描くことで示されました。Optitrack v120 Trioは、スタイラスと筆記板の3次元位置を追跡するために使用されました。修正されたOptitrack Hand Rigid Bodies Marker Setの6つの赤外線反射マーカーは、カスタム3Dプリントマウントを使用してスタイラスの背面に取り付けられました。ライティングプレーンを推定するために、Optitrackマーカーベースを使用してOptitrackカメラに面したライティングタブレットの2つの隣接する側面に6つの追加の赤外線反射マーカーが取り付けられました。スタイラスと文字面の両方が、Motiveを使用して記録されたすべての赤外線マーカーの3次元座標を使用して、カスタムリジッドボディとしてリアルタイムで記録されました。トラックパッドのスタイラスチップの軌道は、スタイラスの位置と向き、および2D書き込み面を使用して推定されました。毎回のサンプルで、スタイラスの硬質体は四元として表されました。先端の位置は、測定された先端の位置で基準スタイラスの四元数を差し引くことによって、記録された四元から推定されました。筆記面は、タブレットマーカーから3つのポイントを選択することから推定されました。最後に、筆記面の2次元座標内のスタイラス先端の位置は、筆記面の法線ベクトルに沿ってスタイラス四元を回転させることによって推定されました。
推測されたスタイラス先端の軌跡を使用して、シーケンスのリコール精度を評価しました。個々の試験ペンの先端の軌跡を視覚的に評価し、指示された手がかりと比較した。口頭および視覚記憶のタスク中に、T12によるエラーはゼロでした。
彼女の描画能力を制限するより高いレベルの麻痺のために、T16で地面の真実の運動活動を集めることができませんでした。
バイナリデコードを使用して、位置ごとのシーケンスエンコーディングを評価する
ブートストラップによる信頼区間の推定
各シーケンス位置でのデコード性能の信頼区間は、デコーダ予測のリサンプリングによって計算されました。各デコーダーについて、クロス検証された予測は置換で再サンプリングされました。特定のシーケンス位置のすべてのデコーダから再サンプリングされた予測は、位置ごとのデコード精度を推定するために結合されました。これは、位置ごとのデコード精度の分布を推定するために10,000回繰り返されました。有意性は、2.5パーセンタイルを取り、チャンスレベルのデコード精度(0.5)の帰無仮説と比較することによって評価されました。
指示された口頭と視覚的な記憶のタスクのデコード精度のペア向上
シーケンスリコールに言語または視覚記憶を使用する明示的な指示の効果の重要性を評価するために、指示された精神戦略のみが異なるペアのデコーダーのデコード精度の増加の分布を位置ごとに推定しました。各デコーダーについて、クロス検証された予測は、デコーダごとの再サンプリング精度を推定するために、置換で再サンプリングされました。次に、指示された精神戦略でのみ異なるデータのペアのデコード精度を減算して、口頭と視覚のメンタル戦略を使用する指示によるデコード精度の増加を計算しました。最後に、これを10000回繰り返して、各位置のデコード精度の増加の分布を推定しました。有意性は、0.025番目の分位数を取り、デコード精度が増加していないという帰無仮説と比較することによって評価されました。
クロスタスク位置デコード
手の運動タスクにおけるシーケンス表現が本当に内面のスピーチによるものかどうかを評価するために、内面のスピーチが使用されるときに、スピーチシーケンスタスクで訓練されたデコーダが手の運動タスクに一般化できるかどうかをテストしました。LDAデコーダは、トレーニングとテストデータが異なるタスクからのものであったことを除けば、5.2と同様に適合しました。
「カウントタスク中に記録された神経活動は、増加する数字のシーケンスに解読できる」方法
指示されていない内なるスピーチを自然に関与させる可能性のある非スピーチタスクをさらに探求するために、参加者が内なるスピーチを使用してターゲットを順次カウントし、この内なるスピーチは、指示された試みのスピーチを解読するように訓練されたRNNによって解読できるという仮説で、結合カウントタスクを完了するよう参加者に依頼しました。このタスクは、実験セッションt15.2024.12.15とt16.2024.12.18でT15とT16で実施されました。
タスクの説明
大語彙内話文タスクコントロール
言葉と自伝的な思考の促し
私たちは、参加者が口頭での思考プロンプトの間に内なるスピーチに従事し、その後、指示された内なるスピーチで訓練されたRNNによって解読できるという仮説を立てました。私たちは、口頭での思考プロンプト中に解読された単語の数が「あなたの心をクリアする」トライアル中よりも多いと仮説を立てました。これは、自由形式の自然主義的な内なるスピーチが、指示された内なるスピーチで訓練されたスピーチBCIによって解読できることを示しています。
また、自伝的な思考プロンプトも含めました。参加者は、口頭での思考とは異なる他の形式の思考(視覚的なイメージなど)に従事する可能性のために選択されました。参加者は、自伝的な思考のプロンプト中に内面的なスピーチに従事することを避けるように明示的に指示されていないため、参加者は内面的なスピーチを使用した可能性があります(たとえば、内部的に口頭で説明することで「毎日の朝のルーチンについて考える」というプロンプトを達成しました)。エピソード記憶や感覚イメージ(視覚、聴覚、嗅覚など)などの他の形態の思考に従事することによって、自伝的なプロンプトを達成することも可能です。したがって、私たちは、口頭思考中に解読された単語の数は、自伝的なプロンプト中に解読された単語の数以上(ただし、それ以下ではない)であると仮説を立てました。
試験ごとに解読された単語の数を評価するために、分析がオフラインで実行されたことを除いて、上記のセクションで説明したのと同じ大語彙RNNと言語モデルが使用されました。デコードされたテキストが参加者の考えを代表するかどうかの不確実性と、精神的なプライバシーの懸念から、このタスクのデコーダー出力を原稿に含めないことを選択しました。カテゴリごとにデコードされた単語数の95%の信頼区間は、10,000回の試行のブートストラップリサンプリングによって計算されました。
「運動皮質には、意図を表す神経次元が含まれており、意図的な音声と内なる音声を区別するのに役立ちます」
インターリーブされた口頭行動指示-遅延タスク
プリンシパルコンポーネント分析の視覚化
内射と射射の神経の神経幾何学をさらに比較するために、主成分分析(PCA)によって決定された上位3の主成分のデータの投影をプロットしました。まず、単語と行動ごとに、神経活動は時間平均化され、試行全体で平均化され、128 x 1の表現ベクトルが得られました(各64電極配列)。14の単語行動条件(7単語x2の動作)で構成された128 x 14マトリックスの列にPCAを適合させます。次に、上位3つの主成分によって作成された3次元空間に、14の平均単語ベクトルすべてを投影してプロットしました。近くの単語を線でつなげて、各行動の中で「単語の輪」を形成して、各単語の相対的な位置をより視覚化し(行は行動全体で一貫して描かれ、色付けされました)、視点を回転させて、輪間の共有構造と輪間の分離が観察できる角度を明らかにしました。
行動内および行動間の交差検証されたユークリッド神経距離
モーターインテント寸法の定義と除去
まず、各行動における個々の単語の繰り返しを平均化しました。
●
●
ここで、KisとKasは、それぞれ内なるスピーチと試みのスピーチ条件の試行回数を表しています。
「簡単な戦略は、プライベートな内なるスピーチがスピーチBCIによって解読されるのを強力に防ぐことができます」
試行と内なるスピーチのトレーニングとテストセット
自己ペースの文章の文脈で、試みと内なるスピーチの関係をさらに調査するために、同じ文セットで構成される試みと内なるスピーチの両方のデータセットを収集しました。次に、行動間で同一の文章のトレーニング/テスト分割を使用して、オフラインでデコーダーを評価しました。すべての文章は50語の語彙から構成されています。データ収集中の中断により文が削除された場合、他の動作の対応する文も削除されました。データ収集中の中断は、試験の削除を正当化するために、咳の発作、参加者のケアの必要性、部屋にいる人による中断、またはタスクコンピュータの音を隠す大きな音(つまり、通過する列車から)で構成されていました。これらはすべて、参加者が特定の試験中にタスクを完全に実行できなかったと考えています。
オフラインデコード評価
ベースライン(チャンスレベル)の単語エラー率を推定するために、RNNが目標の出力と無関係な文を生成した場合に予想されるもの-デコードされた文を対応する根拠の真実文に対してシャッフルしました。このシャッフルは、各シナリオの10種ごとに1,000回繰り返されました。(1)試行スピーチのみで訓練され、テストされました。(2)内面スピーチのみでトレーニングされ、テストされました。(3)スピーチ未遂でトレーニングされましたが、内面スピーチでテストされました。すべてのシナリオで、実際の単語エラー率の信頼区間は、チャンスレベルの推定値よりも大幅に低かった。
「イメージの沈黙」と「イメージのナイーブ」のトレーニング戦略
私たちは、音声BCIのRNNデコーダーのための2つのトレーニング戦略を定義しました。これは、神経活動を音素確率のシーケンスにデコードします。以前の研究で一般的に使用されていた「イメージナイーブ」戦略は、対応する音素で、試みの音声文からの神経活動の試験にラベルを付けます。対照的に、私たちが提案した「イメージサイレント」戦略には、試行データと内部音声データの両方が組み込まれています。このアプローチでは、試みされたスピーチからの試練はまだその音素によってラベル付けされ、内なるスピーチからの試練は沈黙トークン「SIL」のみでラベル付けされます。
トレーニング戦略によるパフォーマンスの解読
ロジットの相関関係
デコーダー出力に対する「画像沈黙」トレーニング戦略の効果を評価するために、私たちは、ペアの試みと内部スピーチトライアルのためにRNNデコーダーによって与えられた音素確率(logits)を分析しました。私たちは、イメージナイーの場合、デコーダーは、試行と内面の話の間に高い相関関係があるため、一致した試行と内面の音声試験について、誤って同様の確率プロファイルを出力する可能性があると推論しました。対照的に、画像サイレンス戦略は、理想的には類似した出力が少ないはずです。これを定量化するために、最初にデコーダ出力をタイムワープして、ペアの未遂トライアルとインナースピーチ試行を一致させ(これにより、スピーキングレートの自然な変動を考慮します)、次にタイムワープロジット時系列間の相関関係(ピアソンr)を計算しました。
キーワード検出による内面音声BCIのリアルタイム評価
内部音声BCIを使用するときに意図しないデコーダー出力を防ぐために、特別なキーワードが検出された場合にのみデコーダー出力をオンにする「キーワード」戦略を調査しました。キーワード検出の特異性を高めるために、めったに話されない音声的に複雑なキーワード(「chittychittybangbang」)が選ばれました。T12は50語の語彙から文章を提示し、ランダムに選択された文章の前に∗記号を追加することを除いて、上記の指示された指示遅延タスクデザインを使用して、運動的な内なるスピーチ戦略を使用して内部でそれらを話すように指示されました。この∗記号は、キューされた文を内部で話す前に、内部でキーワードを話すための手がかりでした。
前述した音声デコードパイプラインを使用しました。RNNデコーダーは、キーワードの有無にかかわらずすべての試行を含む、音素のシーケンスを予測するように訓練されました。キーワードキューで始まる試行は、試行の開始に付けられたキーワードの音素シーケンスでラベル付けされました。例えば、「∗私は良い音楽が必要です」は['CH'、'IH','T','IY','CH','IH','T','IY','B','AE','NG','B','AE','NG','SIL','AY','SIL','N','IY','D','SIL','G','UH','D','SIL',','M','Y','UW','Z','IH',','SIL']とラベル付けされました。
カスタマイズされた言語モデルが構築されました(セクション4.6で説明されているように)、50語の語彙と選択したキーワード「chittychittybangbang」が含まれています。トレーニングコーパスには、元の50語の語彙コーパスと、すべての文の前面に「chittychittybangbang」が追加された複製版の両方が含まれていました。これにより、発話の開始時にキーワードを検出する可能性に関する言語モデルの統計は、キーワードを予測しない可能性と等しく、トレーニングと評価のキューセットの分布と一致しました。最後に、言語モデルで「chittychittybangbang」という単語が検出されない限り、すべての出力を抑制するために、ロジックがリアルタイムデコーダに追加されました。
セッションt12.2024.12.19でキーワード検出によるリアルタイムデコーダーを評価するために、キーワードの有無にかかわらず繰り返される同じ40の文章の手がかりからなる80の試行を収集しました。「∗」でキューされたトライアルがデコーダ出力につながった場合、または「∗」でキューされなかったトライアルが何も出力されなかった場合、トライアルは成功したと見なされました。平均成功率(バイナリ)を報告し、個々の試験(10,000リサンプル)でブートストラップ再サンプリングを使用して95%の信頼区間を計算しました。さらに、デコーダーが単語を正しく生成したキーワード試行の単語エラー率は、前述のように計算されました。これらのエラー率の95%の信頼区間は、個々の試行でのブートストラップ再サンプリングによっても推定され、その後、再サンプリングされた分布(10,000再サンプリング)に対する集計エラー率の再計算によっても推定されました。
定量化と統計分析
追加リソース
補足情報 (4)
ドキュメントS1。表 S1、S2、S4、および S5
表S3。STARメソッドに関連するデータ収集セッションの概要を含むExcelファイル
表S6。STARメソッドに関連するすべての数値の要約統計、サンプルの詳細、エラーバーの説明、および仮説テストを含むExcelファイル
表S7。図3とSTARメソッドに関連する、オンラインデコード評価セッションで使用される補足トレーニングデータの概要を含むExcelファイル
参考文献
ペルズ、E.G.M.∙ Aarnoutse、E.J.∙ ラムジー、ノースファーン...
オランダにおける脳-コンピュータインタフェース神経技術のターゲット集団の推定有病率
神経リハビリテーション。神経修復。2017; 31:677-685
ギルジャ、V。∙ パンダリナート、C.∙ ブラベ、C.H. ...
高性能神経補綴物の臨床翻訳
ナット。医学。2015年; 21:1142-1145
ホッホバーグ、L.R.∙ セルヤ、医学博士∙ フリース、G.M. ...
四分麻痺の人間による義肢装置の神経アンサンブル制御
自然。2006; 442:164-171
パンダリナート、C。∙ ヌユジュキアン、P.∙ ブラベ、C.H. ...
皮質内脳とコンピュータのインターフェースを使用した麻痺患者による高性能なコミュニケーション
eLife. 2017; 6, e18554
シャルク、G. ∙ ミラー、K.J.∙ アンダーソン、N.R. ...
人間の皮質電気信号を用いた二次元運動制御
J.神経工学。2008; 5:75-84
ヌユジュキアン、P.∙ アルビット サナブリア、J.∙ サーブ、J. ...
麻痺した人によるタブレットコンピュータの皮質制御
PLOS One. 2018; 13, e0204566
シメラル、J.D.∙ キム、S.P.∙ ブラック、M.J....
皮質内マイクロ電極配列の移植後1000日後に四頭麻痺の人間によるカーソル軌道とクリックの神経制御
J.神経工学。2011年; 8:025027
ホッホバーグ、L.R.∙ バッチャー、D.∙ ヤロシエヴィチ、B. ...
神経制御されたロボットアームを使用して、四面麻痺の人々が到達し、つかむ
自然。2012; 485:372-375
コリンジャー、J.L.∙ ウォドリンガー、B.∙ ダウニー、J.E....
四性麻痺の個人による高性能神経補綴制御
ランセット。2013; 381:557-564
アジボイエ、A.B.∙ ウィレット、F.R.∙ ヤング、D.R....
四頭麻痺の人の脳制御された筋肉刺激による到達と把握の動きの回復:概念実証の実証
ランセット。2017; 389:1821-1830
ウィレット、F.R.∙ アヴァンシーノ、D.T. ∙ ホッホバーグ、L.R. ...
手書きによる高性能脳からテキストへの通信
自然。2021; 593:249-254
ウィレット、F.R.∙ クンツ、E.M.∙ ファン、C. ...
高性能な音声神経補綴物
自然。2023年;620:1031-1036
メッツガー、S.L.∙ リトルジョン、K.T. ∙ シルバ、A.B. ...
音声解読とアバター制御のための高性能神経補綴物
自然。2023; 620:1037-1046
モーゼス、D.A.∙ メッツガー、S.L.∙ 劉、J.R. ...
無神経障害麻痺者のスピーチを解読するための神経補綴物
N。英語。J.医学。2021; 385:217-227
アヌマンチッパルリ、G.K.∙ シャルティエ、J.∙ チャン、E.F.
話し言葉の神経解読による音声合成
自然。2019年; 568:493-498
シルバ、A.B.∙ リトルジョン、K.T. ∙ 劉、J.R. ...
言語神経補綴物
ナット。神経科学牧師。2024; 25:473-492
カード、N.S.∙ ワイラッカー、M.∙ イアコバッチ、C. ...
正確で迅速に校正する音声神経補綴物
N。英語。J.医学。2024; 391:609-618
バーナード、B。
脳が心を明らかにする方法 神経研究は意識的な経験の基本的な役割を支持する
J.意識。スタッド。2003年; 10:100-114
ハールバート、R.T. ∙ ヒービー、C.L.∙ ケルシー、J.M.
内面的な話の現象学に向けて
意識。コグ。2013; 22:1477-1494
ダルジェンボー、A.∙ ルノー、O. ∙ ヴァン・デル・リンデン、M.
日常生活における未来志向思考の頻度、特徴、機能
アプリ。コグ。サイコ。2011; 25:96-103
ハバード、T.L.
聴覚画像:経験的知見
サイコ。ブル。2010年; 136:302-329
アルダーソン・デイ、B。∙ フェルニーホー、C.
内なるスピーチ:発達、認知機能、現象学、神経生物学
サイコ。ブル。2015; 141:931-965
バドデリー、A.
ワーキングメモリ
科学。1992年; 255:556-559
バドデリー、A.∙ チンコッタ、D.∙ アドラム、A.
ワーキングメモリとアクションのコントロール:タスクの切り替えからの証拠
J.経験。サイコ。将軍2001; 130:641-657
ソコロフ、E.N.
情報処理におけるオリエンテーション対応
ローレンス・エルバウム・アソシエイツ、2002年
ニュートン、午前∙ デ・ヴィリエ、J.G.
話しながら考える:大人は非言語的誤った信念の推論に失敗します
サイコ。科学。2007年; 18:574-579
ハーディ、J.
はっきりと話す:自己話の文献の批判的なレビュー
サイコ。スポーツエクササイズ。2006年; 7:81-97
ドルコス、S.∙ アルバラシン、D.
行動規制の内なる言葉:あなたが自分自身に話しかけると、意図とタスクのパフォーマンスが強化されます
ユール。J.ソック。サイコ。2014年; 44:636-642
ペローネ=ベルトロッティ、M.∙ ラピン、L.∙ ラショー、J.P. ...
私の頭の中のその小さな声は何ですか?内なる言語現象学、認知能力におけるその役割、および自己監視との関係
行動する。脳の解像度。2014; 261:220-239
バドデリー、A.∙ エルドリッジ、M.∙ ルイス、V.
読書におけるサブボーカルの役割
Q.J.経験。サイコ。A.1981; 33:439-454
ソルーシュ、P.Z. ∙ ハーフ、C.∙ リース、S.K....
頭蓋内録音で明らかな、口、想像上のスピーチ活動のネストされた階層
神経イメージ。2023; 269, 119913
タンカス、A.∙ ソロモン、L.∙ アハロニー、Y. ...
音声脳機械インターフェースのための複数の視床下スパイクトレインを解読するための機械学習アルゴリズム
J.神経工学。2021年; 18, 066021
Proix, T. ∙ Delgado Saa, J.∙ クリステン、A. ...
想像上の音声は、低周波数および交差周波数の頭蓋内脳波機能から解読できます
ナット。コミューン。2022年; 13, 48
ブックハイマー、S.Y.∙ ゼフィロ、T.A.∙ ブラクストン、T. ...
オブジェクトの命名と単語の読み取り中の局所的な脳血流
ハム。脳マップ。1995; 3:93-106
パーマー、E.D.∙ ローゼン、H.J.∙ Ojemann、J.G. ...
あからからかのワードステム補完に関するイベント関連fMRI研究
神経イメージ。2001年;14:182-193
黄、J。∙ カー、T.H.∙ Cao、Y。
イベント関連fMRIを使用した無声とあからさ話のための皮質活性化の比較
ハム。脳マップ。2002; 15:39-53
シュスター、L.I.∙ Lemieux、S.K.
秘密的およびあからかに生成された単音節および多音節の単語のfMRI調査
脳ラング。2005; 93:20-31
フリングス、M.∙ ディミトロワ、A.∙ Schorn、C.F. ...
動詞生成における小脳の関与:fMRI研究
神経科学。レット。2006; 409:19-23
芭蕉、S.∙ パーマー、E.D.∙ ルビオ、M.A. ...
意味の流暢さのfMRI適応における生成モードの影響:ペース生産とあから出たスピーチ
神経心理学。2007; 45:1697-1706
キーラー、A。∙ ミルマン、L.∙ ボナクダルプール、B. ...
緊張と合意形態の隠れた発生と明らかな生成の神経相関関係:fMRIからの証拠
J.神経言語学者。2011年; 24:183-201
デ・ボーマン、A.∙ ウィッテヴロンゲル、B.∙ ダウウェ、私...
皮質電図による想像上の音声イベント検出と、音声モードと被験者間の移動
コミューン。バイオル。2024年; 7, 818
マーティン、S.∙ イトゥラテ、I。∙ ミラン、J.D.R. ...
皮質電気撮影を用いた内面音声の解読:音声補綴物への進歩と課題
フロント。神経科学。2018年; 12, 422
チャン、W。∙ 劉、Y。∙ 王、X. ...
音声生成中の運動系と感覚系の間の動的でタスク依存的な表現変換
コグ。神経科学。2020年;11:194-204
池田、S。∙ 柴田、T. ∙ 中野、N. ...
皮質電気図を用いた秘密のアーティキュレーション中の単母音の神経デコード
フロント。ハム。神経科学。2014; 8, 125
マーティン、S.∙ ブルナー、P.∙ イトゥレート、I. ...
訂正:直接脳録音を使用した想像上のスピーチ中の単語ペアの分類
科学。Rep. 2017; 7, 44509
アングリック、M.∙ オッテンホフ、M.C.∙ ダイナー、L. ...
神経活動の低侵襲記録からの想像上の音声プロセスのリアルタイム合成
コミューン。バイオル。2021; 4, 1055
ワンデルト、S.K.∙ ビョネス、D.A.∙ ペジサ、K. ...
ヒト上側回における単一ニューロンによる内部音声の表現
ナット。ハム。行動する。2024年; 8:1136-1149
グラッサー、M.F. ∙ コールソン、T.S.∙ ロビンソン、E.C....
ヒト大脳皮質のマルチモーダル区画化
自然。2016年; 536:171-178
ドラックマン、S.∙ Chklovskii、D.
反復ニューラルネットワーク上の過完全な表現は、永続的な知覚をサポートすることができます
神経インフプロセスシステム。2010年; 541-549
ヴィヤス、S。∙ ゴラブ、医学博士∙ スシージョ、D. ...
ニューラル集団ダイナミクスによる計算
年。神経科学牧師。2020年; 43:249-275
カウフマン、M.T. ∙ チャーチランド、M.M.∙ リュウ、S.I....
ヌル空間での皮質活動:移動なしで準備を許す
ナット。神経科学。2014年; 17:440-448
リー、N。∙ ダイ、K.∙ スボボダ、K. ...
運動計画中の運動前皮質における堅牢な神経動態
自然。2016年; 532:459-464
デュケ、J.∙ イヴリー、R.B.
運動準備中の皮質脊髄抑制の役割
セレブ。皮質。2009年;19:2013-2024
三宅、A.∙ エマーソン、M.J.∙ パディラ、F. ...
タスク目標の検索補助としての内面スピーチ:ランダムタスクキューパラダイムにおけるキュータイプとアーティキュラリ抑制の効果
アクタ・サイコル。2004年;115:123-142
ギルフーリー、K.J.∙ ロギー、R.H.∙ ウェザリック、N.E. ...
三段論的推論タスクにおけるワーキングメモリと戦略
メム。認知。1993年; 21:115-124
トレイスマン、午前∙ ゲラデ、G.
注意の特徴統合理論
知覚から意識へ
オックスフォード大学出版局、2012年; 77-96
ヤロシエヴィチ、B.∙ サルマ、A.A.∙ バッハー、D. ...
自己校正皮質内脳コンピュータインターフェースを使用した四性麻痺患者による仮想タイピング
科学。トランス。2015年7月313ra179
パージ、J.A.∙ ホーマー、M.L.∙ マリク、W.Q. ...
日中の信号の不安定性は、皮質内神経界面システムにおけるデコード性能に影響を与える
J.神経工学。2013; 10, 036004
リヒハイム、L. ...
失語症について
ブロカの登録。
オックスフォード大学出版局、1885; 318-347
ダマシオ、A.R.∙ ゲシュヴィンド、N.
言語の神経基盤
年。神経科学牧師。1984年; 7:127-147
風、J。∙ キアレッリ、B。∙ ビチャクジャン、B. ...
言語の起源:学際的なアプローチ
スプリンガーサイエンス&ビジネスメディア、2013年
プルヴェルミュラー、F。
脳の言語の言葉
行動する。脳科学。1999年; 22:253-279
; 議論 280–336
ブライテンバーグ、V.∙ Pulvermüller、F.
Entwurf einer neurologischen Theorie der Sprache
科学。ナット。1992年; 79:103-117
シッパーズ、A。∙ ヴァンスティーンセル、M.J.∙ フロイデンブルク、Z.V. ...
私の口に言葉を入れないでください:スピーチの知覚は、スピーチBCIの偽陽性の活性化を生成する可能性があります
medRxivでのプレプリント。2024;、2024.01.21.23300437
デクレヴァ、B.M.∙ チャウドゥリー、R.H.∙ バティスタ、A.P. ...
運動皮質は、運動画像中に神経力学を保持し、方向を変更します
ナット。ハム。行動する。2024; 8:729-742
ソルダド=マグラナー、J.∙ アントニエッティ、A.∙ フランス語、J. ...
IEEE BRAIN神経倫理フレームワークを皮質内脳とコンピュータのインターフェースに適用する
J.神経工学。2024年;21日、022001年
ブラウン、C.M.L.
ニューロライト、精神的なプライバシー、そしてマインドリーディング
神経倫理。2024; 17
ヴァン・スタイベンバーグ、O.C.∙ サムラル、D.P.S.∙ ヴァンスティーンセル、M.J. ...
AI主導のスピーチにおけるユーザーコントロールの倫理的意義-BCI:ナラティブレビュー
フェドレンコ、E.∙ Piantadosi, S.T. ∙ Gibson, E.A.F.
言語は主に思考ではなくコミュニケーションのためのツールです
自然。2024; 630:575-586
コンパ、N.A.
内なるスピーチと「純粋な」思考-私たちは言語で考えますか?
フィロス牧師。サイコ。2024; 15:645-662
アリ、Y.H.∙ ボドキン、K.∙ リゴッティ・トンプソン、M. ...
ブランド:ディープネットワークモデルによるクローズドループ実験のためのプラットフォーム
J.神経工学。2024; 21, 026046
デオ、D.R.∙ オコロコバ、E.V.∙ プリチャード、A.L. ...
人間の運動皮質における全身表現のモザイク
bioRxivでのプレプリント。2024;、2024.09.14.613041
マッセ、ニューヨーク∙ ヤロシエヴィチ、B.∙ シメラル、J.D. ...
非因果スパイクフィルタリングは、皮質内BCIの動きの意図のデコードを改善します
J.神経科学。方法。2014; 236:58-67
ヤング、D。∙ ウィレット、F. ∙ メンバー、W.D. ...
機能的電気刺激による微小電極脳記録におけるアーティファクトを減らすための信号処理方法
J.神経工学。2018年; 15, 026014
トラウトマン、E.M.∙ スタビスキー、S.D.∙ ラヒリ、S. ...
スパイクソートなしのニューラル集団動態の正確な推定
ニューロン。2019年; 103:292-308.e4
チェステック、C.A.∙ ギルジャ、V.∙ ヌユジュキアン、P. ...
アカゲザル運動皮質におけるシリコン皮質アレイからの神経補綴制御信号の長期安定性
J.神経工学。2011年; 8, 045005
クリスティ、B.P.∙ タット、D.M.∙ アーウィン、Z.T. ...
皮質内脳機械インタフェース性能のための電圧波形のスパイクソートと閾値の比較
J.神経工学。2015年; 12, 016009
ネイソン、S.R.∙ ヴァスコフ、A.K.∙ ウィルシー、M.S. ...
局所的な単一ユニットが支配するニューロンスパイク活動の低電力帯は、脳と機械のインターフェースのパフォーマンスを向上させます
ナット。バイオメッド。英語。2020年; 4:973-983
ブレイナード、D.H.
精神物理学のツールボックス
スパット。ヴィス。1997年; 10:433-436
ウィレット、F.R.∙ デオ、D.R.∙ アヴァンシーノ、D.T. ...
前運動皮質のハンドノブ領域は、構成的な方法で全身を表します
セル。2020年; 181:396-409.e26
ファン、C。∙ ハーン、N.∙ カムダー、F. ...
皮質内脳とコンピュータのインターフェースのためのプラグアンドプレイの安定性:シームレスな脳とテキストのコミュニケーションの1年間のデモンストレーション
ガオ、L.∙ ビダーマン、S.∙ ブラック、S. ...
The Pile:言語モデリングのための多様なテキストの800GBデータセット
arXivでのプレプリント。2020;
モフリ、M.∙ ペレイラ、F. ∙ ライリー、M.
加重有限状態トランスデューサによる音声認識
ベネスティ、J。∙ ソンディ、M.M.∙ 黄、Y.A.(編集者)
スピーチ処理のスプリンガーハンドブック
スプリンガー、2008; 559-584
ヴァスワニ、A.∙ シェイザー、N.∙ パルマー、N. ...
必要なのは注意だけです
第31回神経情報処理システムに関する国際会議の議事録 NIPS'17
チャン、S。∙ ローラー、S.∙ ゴヤル、N. ...
OPT:オープンプリトレーニングトランスフォーマー言語モデル
クリン。オルトホップ。関係。レス。2022;
ペドレゴサ、F. ∙ ヴァロクオー、G. ∙ グラムフォート、A. ...
Scikit-learn:Pythonでの機械学習
マッハ。学ぶ。パイソン。2011; 6
トレイスマン、午前∙ ゲラデ、G.
注意の特徴統合理論
コグ。サイコ。1980年; 12:97-136
ジョルジーノ、T.
Rでの動的タイムワーピングアライメントの計算と視覚化:dtwパッケージ
J.統計。ソフト。2009年; 31:1-24