Jumat, 02 Oktober 2020

「ポケモン取得ぞーッ!」「燻製肉太郎」 文章を古文っぽくするコンバーター 人気すぎて開発者は「気が気じゃなかった」 - ITmedia

 「ポケモンゲットだぜーッ!」が「ポケモン取得ぞーッ!」に、「ハム太郎」が「燻製肉太郎」に──文章や単語を古文に変換する「古文にする」というコンバーターが、Twitterで話題になっている。

 開発者は機械学習を扱う企業に勤める、すとうけんたろうさん。コンバーターはJavaScriptの練習として、2006年に数カ月かけて趣味で作ったという。これまでに変換に使う辞書データを追加するなどのアップデートも実施しており、現在公開しているのはバージョン3にあたる。変換先に古文を選んだ理由は「現代日本語とよく似ていて、自分が知っている言語だから」という。

photo 「古文にする」の画面

 すとうさんによれば、9月29日までGoogleからの流入数は1日に500件ほどだったが、30日深夜に急増。10月1日には約1万5000件になり、同日午後にはアクセス集中で一時的につながりにくい状態になった。

 Twitterからの流入を計測しておらず、実際にはさらに多くのアクセスがあった可能性があるとしている。1日の午後、すとうさんは家におらず、アクセス集中への対策ができなかったため「気が気じゃなかった」という。

ヒットの理由は「語尾」と「甘え」?

 古文にするでは、入力された文章を単語に分解し、順番に古語に変換している。辞書データは、新世代コンピュータ技術開発機構(93年に解散)が公開していたものなどを使っている。「語尾が変わったほうが変換後の文章が面白く、(条件)分岐も少ない」(すとうさん)として、文章を後ろから変換しているという。

photo 記事冒頭を変換した様子

 英語や“カタカナ語”にもある程度対応するが、2単語以上の英文は漢字だらけになったり、あいさつは現代日本語のままだったりと、完全には変換できない。すとうさんも「この辺は(変換が)難しいと思っている部分。できないところはそのままでいいという甘えで作っている」といい「漫画のせりふなどに用いる際は、古語辞典や現代古語類語辞典で調べ直すことをおすすめします」としている。

photo 10月1日のTwitterトレンド

 だが、ユーザーの間では不完全な翻訳が面白いと人気になり、Twitterでは変換前後の文章をシェアする人が続出。10月1日には「ハム太郎」を変換した「燻製肉太郎」がTwitterトレンド入りを果たした。すとうさんも「とんちんかんな変換が受けた」と推測している。

 すとうさんは「『ウルトラマンZ』の主題歌や『Get Wild』の歌詞を変換したものが面白かった」と話す。話題になったことについては「意外と凝った動きをすることに気付いてもらえていたらうれしい」としており、今後は今回のヒットでシェアされた文章をサンプルに、適宜アップデートを行う方針だ。

Let's block ads! (Why?)


https://news.google.com/__i/rss/rd/articles/CBMiPGh0dHBzOi8vd3d3Lml0bWVkaWEuY28uanAvbmV3cy9hcnRpY2xlcy8yMDEwLzAyL25ld3MxMjkuaHRtbNIBAA?oc=5

2020-10-02 09:20:00Z
52782774967985

Tidak ada komentar:

Posting Komentar