RubyKaigiのスピーカーごとに何年に何というタイトルの発表をしたのか抽出するスクリプトを書いていた。名前と発表年とタイトルを見ているだけで楽しい。
抽出結果はこんな感じで名前をキーにしてまとめている。ライセンス的にOKそうならWeb上で表形式か何かで見れるようにしたいけど、2023年から2013年まででユニークなスピーカーが約291名いるのでどう見せるといいかはあまり想像がついていない。
"Mari Imaizumi"=> {:"2021-takeout"=> {:id=>"@ima1zumi", :title=>"Dive into Encoding", :url=>"/2021-takeout/presentations/ima1zumi.html"}, :"2022"=> {:id=>"@ima1zumi", :title=>"String Meets Encoding", :url=>"/2022/presentations/ima1zumi.html#day3"}, :"2023"=> {:id=>"@ima1zumi", :title=>"UTF-8 is coming to mruby/c", :url=>"/2023/presentations/ima1zumi.html#day1"}},
IDをキーにしなかったのは2022年はXのIDで他はGitHubのIDだったりで名寄せが大変なのと、昔のRubyKaigiはスケジュールページにIDの表記がなかったため。名前も名寄せが必要な人はいたけど、ぱっと見はそこまで多くなさそうだった。
年を遡るにつれて段々とHTMLをパースしづらくなっていって歴史を感じる。今は2011年をやっているところ。2006年までやるつもりだけど、2006年は英語版のタイムスケジュールがないので手でデータ作るかなぁ。