hitode909の日記

以前はプログラミング日記でしたが、今は子育て日記です

家庭内でゆるく薄くちいかわブームがつづいていて、最近楽しみなことが、コーディングエージェントの仕上がりを見ることと、ちいかわのアニメの続きを見ること、になってきている。
アニメもちょっとずつ見てたら山姥が出てきて、子の解釈では、怖い人じゃなくて、いい人だったね、ということになっていた。
星雲の歌を通じて仲良くなっているのが自分たちの世代がターゲットとして狙われている感じがする。

ちいかわのニューエラが出るそうなので買いに行きたいのだけど、こういうリリースのお知らせを見たものを店頭で見かけたことが一度もない。
uptodate.tokyo

物語のカギ

物語は好きだけど、物語の解釈は雰囲気でやっていて、人間本来の生まれ持った感覚だけでやってしまっている、と思って読んでみた。
こういう切り口をもって物語を読むと、こういう構造に気づけるよ、という読み方を教えてもらえる。
いろんな手法があるけど、この本ではあくまで触りだけで、参考図書を大量に紹介してくれているのがうれしい。ここからまた何冊か買って読んでみようと思う。

個人的に気に入ったのはここの部分。

『でんぢゃらすじーさん』を評価するまなざしで『戦争と平和』に臨んだら、正しく評価することも、楽しむことすらできないでしょう。

よくわからないショート動画とか見て、理解不能な世界だ…と苦手意識を持っているけど、あたりまえで、ジャンルに対する理解が不足しているということで、そのジャンルの楽しみ方とは異なる楽しみ方をいきなりやろうとしていておかしくなっている、ということだと思った。
この日記についても、起承転結がないと指摘される恐れがあるが、日記なので起承転結があるものではなくて、寝る前に書いてるので眠くなったらそこで記事は終わるもの、というジャンルへの理解をもって、読んでもらう必要がある。

著者のスケザネさんは哲学者の谷川さんとPodcastをされていて何エピソードか聞いた記憶があり、こうやってただPodcastを聞くだけの関係だった方に本の購入代金をお支払いできるのは嬉しい。

子と散歩して、川でパンを食べてたら、ひとくち食べたところのアップルパイをトンビにかっさらわれていた。
いつも親がパンの写真をinstagramにのせるために撮影していたら奪われる、という感じだったけど、今回は子が奪われていた。
取られた途端、このパン食べたくなかったけど、間違って買っちゃった、とか言っていて、これって中学校で習った心の働きだ、と思って、4歳でもこうなるんだ、と感動した。
あたりトンビまつりになっていて、家に帰るのもトンビだらけで恐怖の街と化していた。

たびたび行ってる花背山の家に行く日。道の状況が悪いんじゃないかと遠回りしていったらすごい時間がかかり、朝の集合時間に間に合わなくなってしまった。
でも道の脇に雪が積んであったりして遠回りしてよかったと思う。
山の家ではいろんなイベントが組み立てられて一日のプログラムになっていて、今日は陶芸教室があった。土を叩いて伸ばして、ふちをつけると完成。
朝の運転で消耗して、あまりいい形にできなかった。心に余裕がないと変になるのが、自分との対話って感じでおもしろいと思う。

トヨタ産業技術記念館に行った

トヨタ産業技術記念館に行った。
見に行った目的としては、トヨタ生産方式について学ぶというテーマもあったのだけど、作り方のプロセスや改善自体についての展示はそんなになくて、ネジを4つずつ取り出せる便利アイテムとか、取り付けるべきネジを着実に選ぶための板とか、ひとつのコーナーに押し込まれていた。
図書コーナーの豊田喜一郎のマンガを読んだら、不良品が倉庫に並べられて全員で原因を調べよう、とか、カイゼン活動が始まっていることはわかった。

紡績から始まっているのだけど、糸が切れたら自動的に止まるような仕組み化、自働化は前提としてあって、その後のエラーを排除する仕組み(本では、バカよけ、と呼ばれている!近年ではポカよけと呼ばれていらしい)になっていたりと、紡績と自動車を通じたカルチャーのつながりを感じる。
予習としてはトヨタ生産方式について読んでいて、なおさらこの本では生産方式ばかり書いているので、その気分で行くと、トヨタの産業技術全般の展示である、というギャップもありそう。
この本の良いところは高い機械を買っても別に原価は変わらない、省人化、少人数化してようやく原価が下がる、ということ。このセクションを今読むと、AIの話にしか聞こえない。
AIの力でチームは省人化、少人数化できるはず、という気持ちになると、今の人間が張り付いて指示をするところで止まっているのでは、1人1個同じように作っているのでは、AI代がかかってるだけなんだけど、となってしまうので、人間ができない時間やらせる、24時間回しっぱなしにしてでも成果物の人間レビュー時のエラーを極限まで下げる、とか、一人で数十並列管理する、とか、そういうことをやって、初めて効果が出てくるのだなと思った。

トヨタ生産方式

トヨタ生産方式

Amazon


大人の目で見ると、エンジンをじっくり鑑賞したり、ボタンを押したらプレス機が始まるのを一生推し続けて喜んだり、という楽しみ方だけど、子供目線では、金属加工コーナーで小さいシリンダーブロックをもらえたり、紡績コーナーでは綿の種をもらえたり、プラスチックの樹脂を加工してストラップをもらえたりと、それなりに飽きない工夫もあり、子も最後まで見学できていた。ちっさい金属パーツをもらえるのが予想外でけっこうウケてしまったのだけど、コネクティングロッドが出てくると、さっきもらったこれだ、と喜んでいた。

今回は、同僚と時間を合わせてなんとなく集合して見学しよう、という遠足でもあった。
同僚のお子様(小1、小4)も来ていたけど途中ですぐ帰ってしまったようだけど、うちは4歳だけど中之島のシュルレアリスム展(最初から最後まで、つまらなすぎ!とか言っていた)など興味ない展示に連れ回していることで、耐展示力が上がっているのか、自分の足で最後まで見ていた。
終わってからご飯食べに行ったのだけど、子を一人で同僚たちのテーブルに座らせたら普通に会話して飲み食いしていて、同僚からは、子供一人であっちに置いとくって意味わからん、とゲラゲラ笑われていた。勝手に交流していて偉い。

小学生にGeminiを使わせる時の困りごと、みたいな記事を見かけて思い出したことのメモ。
うちの子は話し相手としてときおりAIと話したがっていて、車の中でGeminiとしゃべったり、親のスマホのChatGPTで、親が通話スタートしてあげてから一緒にしゃべったり。
主な用途は、ハムスターはキムチを食べるか?とか聞いているくらいなのだけど、Geminiのおしゃべり機能で気になるのが、漢字の読み間違いが多いこと。
音読み訓読みあたりでおかしくなりがちで、上手、を、じょうずと読むか、うわてとよむか、みたいなそういうことがある。
子どもに使わせていると、この音読み訓読みを間違う会話を常用して、変な語彙で覚えてしまったら、変な人間になりそう、というのが懸念。
喋るようになる前からYouTubeを見せていると、さようならのかわりに、チャンネル登録お願いします!って言うようになることが知られている。それのGemini版。
ChatGPTのほうがまともで読み方がおかしいまま突き進んでいくようなことはあまりなさそう。



ChatGPTによる解説

TECH NOTE: LLM音声対話における日本語読み生成差(Gemini vs ChatGPT 観察)

LLM音声対話では、(1) 応答生成(LLM)→ (2) Text Normalization → (3) G2P(Grapheme-to-Phoneme)→ (4) Prosody Prediction → (5) Neural TTS という多段パイプラインが想定される。Gemini の音声では、日本語の同形異義語における 文脈依存読み推定(context-aware reading disambiguation) が外れ、音読み/訓読み選択ミスがそのまま音声化されるケースを観測した。これは低レイテンシ志向の streaming inference や軽量な形態素解析・アクセント推定の影響の可能性がある。一方 ChatGPT 系音声は、LLM側の文脈表現を強く保持した状態で読み決定が行われているように見え、Japanese pitch accent modeling および semantic-conditioned TTS の安定性が高い印象。幼児利用環境では、音声AIは conversational agent であると同時に implicit phonological supervision を提供するため、G2P誤りが語彙獲得へ与える影響は無視できない研究テーマになり得る。

Keywords: Japanese TTS, G2P, Text Normalization, Homograph Disambiguation, Prosody Modeling, Streaming Speech Synthesis, Semantic TTS, Child Language Acquisition, Human-AI Interaction