【朗報】江戸時代の地震記録した古文書495点 解読が完了!!作業には4000人以上の一般人も協力・・・

001.jpeg

1: しじみ ★ 2019/04/07(日) 18:56:33.36 ID:CAP_USER

京都大学は、地震研究所図書室が所蔵する江戸時代の地震を記録した古文書495点の解読を終了したと発表した。2017年1月にスタートした解読作業は、4600人を超える一般市民が参加してくずし字で書かれている古文書を、一字ずつ現代文字に活字化するというプロジェクトで、過去の災害の歴史を学ぶきっかけにつながるという。

 古代から地震が多かった日本では、『日本書紀』に残る416年の「允恭(いんぎょう)地震」を最古として、数多くの史料が残されている。しかし、解読されたのはそのうちのほんの一部で、有益な情報のほとんどが手付かずの状態だ。
01.png

■くずし字学習アプリを使ってゲーム感覚で学ぶ

 京都大学大学院の「古地震研究会」は2017年1月、東大地震研究所の図書室が所蔵する古文書495点をインターネット上に公開し、Wikipediaのように閲覧者が現代文字に書き換えるプロジェクトを開始。これまでに4626人が登録し、このうち347人が実際に文字の入力作業に参加した結果、新書30〜35冊分の文字数にあたる465万文字が入力されたという。

「みんなで翻刻」というこのサイトには、数多くのくずし字のパターンや、江戸時代の本から収集した3000種類近い熟語が収録されており、くずし字学習支援アプリと連携することで、初心者でもくずし字を学ぶことができる機能が備わっている。(翻刻=文字起こし)
2.jpg

■過去の災害の歴史を学ぶきっかけに

 スタート当初は、地震研究所二代目所長をつとめた地震学者の石本巳四雄(みしお)氏がコレクションした114点の災害史料の翻刻を目標としていたが、開始から5カ月後には完了。その後、資料を追加することで495点すべての作業が終わった。

 今後は、ほかの資料館が所蔵する史料も登録を進め、翻刻を続ける計画なので、興味がある人は今からでも遅くない。パソコン1台あれば誰でもアクセスできるので、ぜひ一度サイトを訪問してほしい。古文書の解読の楽しさはもちろん、自分が住んでいる地域で過去に起こった地震の歴史を学ぶこともできる。
3.jpg

ハザードラボ
https://www.hazardlab.jp/know/topics/detail/2/8/28696.html

4: ニュースソース検討中@自治議論スレ 2019/04/07(日) 19:04:13.21 ID:1PproGqT

普通に人工知能使ってテキスト起こしする研究予算割り振れよ
6: ニュースソース検討中@自治議論スレ 2019/04/07(日) 19:41:27.28 ID:JpYKwAVJ

>>4
人工知能に教師データは必須
今回のプロジェクトで作った教師データを作ったとも言える
13: ニュースソース検討中@自治議論スレ 2019/04/07(日) 20:51:25.00 ID:KRahUKmZ

>>4>>6
ディープラーニングでくずし字を解読する研究はある。
江戸時代の版木本の大多数は活字に翻刻されているし、手書き文書も万単位のものが活字に翻刻されているから、ディープラーニングさんが勉強するために充分なデータはあるよ。
次の課題は、ディープラーニングさんにくずし字を書かせることかも。


if(navigator.userAgent.indexOf(‘iPhone’) > 0){
document.write(”);
} else if( navigator.userAgent.indexOf(‘Android’) > 0 ) {
document.write(”);
} else {
;
}

20: ニュースソース検討中@自治議論スレ 2019/04/08(月) 03:57:12.37 ID:7/12Jpb0

こういうのこそ特徴量抽出するディープラーニングでやらせろよ
14: ニュースソース検討中@自治議論スレ 2019/04/07(日) 21:41:43.31 ID:r+JaAFuK

>>13
長文書いてるけど肝心の「使い物になるのか」に触れてないのはなぜですか
5: ニュースソース検討中@自治議論スレ 2019/04/07(日) 19:20:02.05 ID:yqSIGp64

これで浮世絵春絵とかのいやらしい版画も読めるようになるの?
12: ニュースソース検討中@自治議論スレ 2019/04/07(日) 20:32:39.57 ID:MAluT3cx

楽しそうやん
春画の翻訳とかやってみてえw


if(navigator.userAgent.indexOf(‘iPhone’) > 0){
document.write(”);
} else if( navigator.userAgent.indexOf(‘Android’) > 0 ) {
document.write(”);
} else {
;
}

7: ニュースソース検討中@自治議論スレ 2019/04/07(日) 19:45:18.42 ID:/fShfXrD

日本文学部に頼んだら手間がはぶけるけど、それじゃ意味ないんだろな、江戸しぐさ的に
9: ニュースソース検討中@自治議論スレ 2019/04/07(日) 20:13:05.43 ID:aJJlSfVm

調子に乗ってありとあらゆる古文書でやるべき
http://mv-mindhack2ch.up.seesaa.net/common/kijinaka.js
10: ニュースソース検討中@自治議論スレ 2019/04/07(日) 20:25:50.36 ID:w/D+X9Yt

AIよりも安い日本人労働力
11: ニュースソース検討中@自治議論スレ 2019/04/07(日) 20:30:14.83 ID:8IARNqOk

>>10
まあ書物やら言葉とは数字と違って人に読んでもらうものだから
AIには限度があるのさ


if(navigator.userAgent.indexOf(‘iPhone’) > 0){
document.write(”);
} else if( navigator.userAgent.indexOf(‘Android’) > 0 ) {
document.write(”);
} else {
;
}

21: ニュースソース検討中@自治議論スレ 2019/04/08(月) 04:38:07.80 ID:WmA9hzB+

将来はAIが翻訳するようになるだろう
22: ニュースソース検討中@自治議論スレ 2019/04/08(月) 04:52:46.08 ID:G7R6tOXX

>>21
英文、和文も早くなんとかなるとよいな
15: ニュースソース検討中@自治議論スレ 2019/04/07(日) 21:55:32.26 ID:aweIuDoL

プロジェクト思いついた人は頭いいなぁw
何かやりたいけど金もないし、やりたいことも特に思いついてないヒマ人いっぱいいるだろ
16: ニュースソース検討中@自治議論スレ 2019/04/07(日) 22:04:16.72 ID:b0o239g8

崩し字も難しいけど、変体仮名って奴も難しいよな


if(navigator.userAgent.indexOf(‘iPhone’) > 0){
document.write(”);
} else if( navigator.userAgent.indexOf(‘Android’) > 0 ) {
document.write(”);
} else {
;
}

17: ニュースソース検討中@自治議論スレ 2019/04/07(日) 22:23:10.15 ID:IaJwn6oo

多くの点で理にかなった試みだね
18: ニュースソース検討中@自治議論スレ 2019/04/07(日) 23:37:49.51 ID:vhUAyZGj

紙に記されている記録ってのは、地球の長い長い時間軸からすれば
ほんの一瞬の出来事を切り取ったものに過ぎないのよな。
28: ニュースソース検討中@自治議論スレ 2019/04/08(月) 10:36:45.92 ID:5av/mcvO

漢文で書かれてるほうが簡単に感じる古文書

暗号にしか見えないわ

30: ニュースソース検討中@自治議論スレ 2019/04/08(月) 18:44:02.67 ID:ck45wtww

>>28
漢字じゃなく楷書の木版印刷では?
くずし書きは個人書籍も含まれる
そもそも毛書文化はくずし字やで
アルファベットのくずし字よりは量は


if(navigator.userAgent.indexOf(‘iPhone’) > 0){
document.write(”);
} else if( navigator.userAgent.indexOf(‘Android’) > 0 ) {
document.write(”);
} else {
;
}

25: ニュースソース検討中@自治議論スレ 2019/04/08(月) 05:32:53.88 ID:MoubYqvX

でも又忘れるんだろうな
26: ニュースソース検討中@自治議論スレ 2019/04/08(月) 06:01:44.58 ID:BsgMNugD

字は読めてもまだ難しいな 単語が違う
http://mv-mindhack2ch.up.seesaa.net/common/kijisita.js

元スレ:http://egg.5ch.net/test/read.cgi/scienceplus/1554630993/

Source: mindhack
【朗報】江戸時代の地震記録した古文書495点 解読が完了!!作業には4000人以上の一般人も協力・・・