2019年04月08日

◆ 音声認識アプリで起業しよう

 音声認識技術が劇的に向上したので、これを利用したアプリを開発するといい。起業して、儲けよう。

 ──

 近年、急成長した会社というと、Web サービスの会社がほとんどだ。Google 、Amazon、Facebook など。GAFA の一角である Apple も、ハードだけでなく、Web サービスでも儲けているから、部分的には Web サービスの会社である。
 日本でも同様で、新興企業で急成長したのは、Web サービスの会社がほとんどだ。ZOZO タウンとか、メルカリとか。(一般的な IT会社も多いが。)

 さて。こうなると、今さら Web サービスの分野に進出しようとしても、出遅れ感を覚えるだろう。「もはや時遅し」という感じだ。
 そこで、こう期待する。
 「 Web サービスとは別に、未開拓の領域はないか? 誰も進出していない、新しい未知の領域はないか? そこにいち早く参入して、大きな先行者利得を得たいのだが」
 そういう うまい領域を探そうとする人もいるだろう。そこで教えよう。こうだ。
 「 Google の音声認識技術が劇的に向上したので、これを利用したアプリを開発するといい」


 理由はこうだ。
 「前項で述べたとおり、 Google の音声認識技術が劇的に向上した。そこで、これを利用したアプリを使えば、AI の機能をもつアプリが作れる。そういうものは、まだ作られていないから、いち早く進出することで、大きなシェアを獲得できる」


 以下では詳しく説明しよう。

 ──

 まず、Google の音声認識技術が劇的に向上した。この件は、前項で述べたとおり。(そのリンク先に記してある。)
  → AI で人は失業する?: Open ブログ
 
 この音声認識技術は、Google 製だ。これと同等のものを他社が開発しようとしても、まず無理だ。Apple も、なかなか追いつかないだろう。まして、サードパーティの会社はとうてい無理。
 しかしながら、Google はこれを要素技術として、他社に有償で提供するはずだ。( API )
 この要素技術を、他社製アプリに組み込んで、一般的なソフトウェアとして販売すればいいのだ。

 例1。会議の議事録。

 音声認識技術を使って、会議の議事録を作る。ただし、単に音声認識技術を使うだけでは足りない。どの発言者が発言したのかがわからないからだ。この区別をするには、次のような方法が考えられる。
  ・ 各人ごとに別のマイクを用いる。
  ・ 各人が冒頭で「山田です」というふうに名乗る。

 こういうふうに、何らかの工夫が必要だ。こういう工夫を含めて、パッケージソフトとして提供するといい。さらには、「機械入力の議事録を、人手で修正する」というサービスも考えられる。

 例2。ホテルの接客。

 ホテルの接客では、AI は、現状の水準では、とうてい使い物にならない。(前項で述べたとおり。)
 しかしながら、Google の音声認識技術を使えば、かなりの程度、実用に近い水準で使えると思える。間違いやすそうなときには、人を呼び出すことにすれば、間違いの問題も減るので、実用的になりそうだ。少なくとも、定型的な会話なら、何とかなりそうだ。

 例3。電話受付

 電話受付は、話の内容がかなり限定的なので、機械で代替することが可能になりそうだ。特に、Google の音声認識技術を使えば。
 ただし、分野ごとに、かなりカスタマイズすることが必要だろう。たとえば、次のようなもの。
 「大学入試の補欠入学者を決めるための電話連絡」
 このようなことは、現状では人がやっている。
 受験生に1人ずつ電話で追加合格を伝えて入学の意向を確認しており、3月末は対応に忙殺された。
( → 大学の「駆け込み合格」増える 受験者、喜びと困惑  :日本経済新聞

 だが、人がやるのは面倒臭そうだから、機械に任せるとよさそうだ。そこで、そのためのアプリを開発するといい。

 ──

 以上のように、特定業務のためにカスタマイズしたアプリがあると便利だ。
 しかしそれを作ることは、Google にはできない(いちいちやらない)ので、専門で扱う会社があるといい。かくて、そのような企業が必要とされる。
 かくて、このような企業を、人に先んじて、いち早く設立するといいだろう。先んずれば人を制す。

posted by 管理人 at 20:00| Comment(0) | コンピュータ_04 | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ