研究開発

Beyond the Boundary: 越境せよ

PKSHA ReSearchは大学の研究室とは、異なる研究アプローチを採用しています。
先端情報技術の研究結果を社会実装するには、主に3つの制約条件をクリアする必要があります。第一に、如何に社会/消費者ニーズと適切に接続しユーザーに届けるか、第二に、異分野の技術を如何にうまく擦り合わせ付加価値につなげるか、第三に、キャッシュフロー(付加価値の循環)が回る形で如何に社会に届けるか。
PKSHA Technologyは様々なパートナー企業・大学と連携し、分野間の「知を跨ぎ」、先端情報技術を社会実装する方法を探究しています。

Features特徴

共創型 - 研究一人でやらないCo-Creation
一人で部屋に篭るのではなく、各分野をリードする研究室・企業との共同プロジェクトを通じて、知を深めます。情報技術を最速で社会実装するためには、社会インフラを提供し、独自のデータを持つ企業の協力が必要です。研究室とも連携し、先端情報技術を、いち早く社会実装することを目指します。
異分野 - 境界分野をまたぐMulti Disciplinary
年々、各研究分野で、知は深まり細分化し続けていますが、同時に、複数の分野を紡ぎ合わせる重要性も高まり続けています。私たちは、異分野の「境界」に潜む「新たな知の発見」を大切にしています。
(例: マルチモーダルソリューション (自然言語/音声/動画像 等)、バイオ × 情報技術 等 )
実践型 - 研究試して深めるCreativity is Practice
「現実は人の脳よりも複雑である」という考えのもと、考えるだけでなく、作って動かしてみること(プロトタイピング・デモ)を大切にします。現実世界で実際に動かすことで、フィードバックループを回し、世界の見え方自体をアップデートし、知の解像度を上げていきます。

PKSHA  Algorithm Modules要素技術

音声認識・音声合成モジュールVoice Recognition & Synthesis
人が発話した音声を正しく言語化し理解した上で、自然なアクセントの合成音声による伝達を通じて、人とソフトウエアの高度なインターフェースを実現します。
自然言語処理モジュールNatural Language Processing
言葉(自然言語)で表現され、伝達される情報を理解し、必要な情報の抽出・整理・解釈・検索・変換・応答・生成等の様々な処理を通じて、人々のコミュニケーションや意思決定を支援します。
動画像認識・動画像合成モジュールVideo/Image Recognition & Synthesis
画像や動画から人や物体や背景などあらゆる情報を抽出、撮影状況の推定も含めて、解釈や合成を行います。動画像は監視カメラやモバイルデバイスあるいは業務用機器など、様々な機器から得ることができ、それらに対して定期的な一括処理もしくはリアルタイムで認識および解析結果を提示し、業務負荷軽減はもとより業務フロー全体の知能化を推進します。
予測/推論/最適化モジュールPrediction/Inference/Optimization
現実世界の多種多様なデータから人が認知しづらいパターンを抽出する「予測・推論」技術と、抽出されたパターンに基づいた最適な意思決定をフィードバックする「最適化」技術とを組み合わせる事で、様々な分野・業界の知能化を実現します。

Research actions研究実績

  • 自然言語処理
    自然言語処理ライブラリ「Camphr」(カンファー)をオープンソースとして公開
  • 自然言語処理
    日本語音声合成向けに東京式アクセントを自動推定する自然言語処理ソフト「tdmelodic」がオープンソース化
  • 音声・音響処理
    多数の話者が同時に話す環境下での音源分離技術 SinkPIT を開発
  • 音声認識・音声合成
    最先端音声合成技術を活用したAI音声合成サービスを開始
  • 動画像認識・動画像合成
    オーダーメイドブランド「KASHIYAMA」に画像不要のサイズ推定技術を提供