東京大学大学院 情報学環・学際情報学府 The University of Tokyo III/GSII

ニュース News

February 6, 2025

矢作優知さん,中條麟太郎さん,原田悠我さん,韓燦教さん,杉山昂平さん,苗村健さんの発表「LLMを用いた研究論文の会話形式ポッドキャストへの変換システム PaperWave の開発」がHCGシンポジウム2024で最優秀インタラクティブ発表賞を受賞しましたA presentation titled “Developing PaperWave: A System for Adapting Research Papers into Conversational Podcasts with LLMs” by Yuchi Yahagi, Rintaro Chujo, Yuga Harada, Changyo Han, Kohei Sugiyama, and Takeshi Naemura won the Best Interactive Presentation Award at the HCG Symposium 2024.

矢作優知さん,中條麟太郎さん,原田悠我さん,韓燦教さん,杉山昂平さん,苗村健さんの発表「LLMを用いた研究論文の会話形式ポッドキャストへの変換システム PaperWave の開発」がHCGシンポジウム2024で最優秀インタラクティブ発表賞を受賞しました

 

研究発表「LLMを用いた研究論文の会話形式ポッドキャストへの変換システム PaperWave の開発」が,電子情報通信学会ヒューマンコミュニケーショングループが主催するHCGシンポジウム2024(https://www.hcg-ieice.org/hcg-symposium/2024/)で最優秀インタラクティブ発表賞を受賞しました.この賞は120件を超える発表のうち,参加者の投票により最も優れた発表と評価された1~2件(各日ごと)の発表に対して贈られるものです.

 

研究概要

研究論文のPDFから,論文紹介ポッドキャスト音声を自動生成するシステム PaperWave (https://paperwave.app) の試作プロセスを,2ヶ月間にわたる日記などのデータをもとに記述しました.そして,PaperWaveのような文書を音声に変換するシステムのデザイン上の考慮事項を考察しました.これにより,大規模言語モデル(LLM)を活用して論文を「ながら聞き」する可能性を探索しました.

 

発表者

矢作優知(先端表現情報学コース,苗村研究室,博士3年)
https://yuchi.jp

 

共著者

中條麟太郎(先端表現情報学コース,苗村研究室,修士2年)
https://www.chujo.me

原田悠我(Educe Technologies)

韓燦教(情報学環,特任講師)
https://changyohan.com

杉山昂平(情報学環,特任研究員)
https://researchmap.jp/ksugiyama

苗村健(情報学環,教授)
https://nae-lab.org

 

関連リンク

https://paperwave.app

PaperWaveは一般公開しており,どなたでもお試しいただけます.
https://yuchi.jp/doc/hcgsympo2024-paperwave.pdf

発表予稿のPDFです.研究の詳細を記載しています.
https://doi.org/10.1145/3706599.3706664 (プレプリント: https://arxiv.org/abs/2410.15023)

PaperWaveに関するフィールド調査について詳しく記載している英語論文です.こちらは2025年5月に開催されるACM CHI2025のCase Studiesにて発表予定です.

 

研究紹介動画

 

 

<<英文>>

“Developing PaperWave: A System for Adapting Research Papers into Conversational Podcasts with LLMs” was awarded the Best Interactive Presentation Award at the HCG Symposium 2024 (https://www.hcg-ieice.org/hcg-symposium/2024/), organized by the Human Communication Group of the Institute of Electronics, Information and Communication Engineers. This award is given to the 1-2 presentations (per day) voted as the best out of over 120 presentations by the participants.

 

Abstract of the Presentation:

PaperWave is a system that automatically generates conversational podcasts from research paper’s PDFs. We describe PaperWave’s prototyping process based on data, including diaries from two-month real-world usage. We then discuss the design considerations of document-to-audio adaptation systems like PaperWave. In sum, we explored the possibility of mobile reading of papers using large language models (LLMs).

 

Presenter:

Yuchi Yahagi (Emerging Design and Informatics course, Naemura Lab, 3rd year of doctoral program)

 

Co-authors:

Rintaro Chujo (Emerging Design and Informatics course, Naemura Lab, 2nd year of master’s program)
https://www.chujo.me

Yuga Harada (Educe Technologies)

Changyo Han (III, project lecturer)
https://changyohan.com

Kohei Sugiyama (III, project researcher)
https://researchmap.jp/ksugiyama

Takeshi Naemura (III, professor)
https://nae-lab.org

 

Links:
https://paperwave.app

PaperWave is open to the public, so anyone can try the demo.
https://yuchi.jp/doc/hcgsympo2024-paperwave.pdf

The proceeding of the presentation. It contains details of the research.
https://doi.org/10.1145/3706599.3706664 (preprint: https://arxiv.org/abs/2410.15023)

This English paper describes the field study on PaperWave in detail. This paper will be presented at the ACM CHI 2025 Case Studies, held in May 2025.

 

Video figure: