12/29/2012

Sorting in Japanese

(Oh wow, English!)

Sorting in Japanese has always been an interesting topic to me because ... well, it just can't be done totally automatically.

This crosses my mind whenever I'm using my iPod and want to find a Japanese artist name that's written in (or at least begins with) kanji. My iPod sorts them, but I can't figure out how in the world it's organized them. Thus, finding Japanese artist names and album names can be a frustrating affair. (I don't often do it, though, so at least it's a rare nuisance.)

Anyway, while searching for information about this issue online, I found a nice blog post entitled "Sorting in Japanese—An Unsolved Problem." It explains why sorting in Japanese is such a difficult problem and looks at some of the ways the problem has been tackled in the past. Check it out if you're interested.

2 comments

bikenglish said...

一読では理解できなくて、二読、三読して何とか理解しました。(なお、二読、三読は一般的使われる言葉でありません、念のため。)

漢字のまま、ソートすると、確かに変な順番になってしまいますね。例えば、人名で「林」(はやし)が、ハ行より後ろになっていたり。ちゃんと確認していませんが、漢字のJISコードは「音読み」の順番になっているからだろうと思います。

関連webpage

ちょっと関連した話ですが、人気のあるレストランなどで、待っている客を順番に案内するため、客の名前と人数を書かせることがあります。その時の注意書きに、「市名はカタカナで記入してください」と書いてあることがよくあります。

漢字で書いてあって、読めない字だったりすると、接客する人が困りますからね。

よくある名前で「東」ってあるけど、「あずま」と読むか「ひがし」と読むか、本人に聞かないとわからないという「やっかいな名前」もあります。

ジョン said...

ウェブサイトに登録するときも、名前の読みも記入するように書いてあったりしますね。(僕にとってする必要はないのですが、この前、名前を「Jonathan」とアルファベットで書いて、読みをカタカナで書きました。それなら読みが役に立つと思いまして。)

日本の人名は今でも僕にとって難しいんです。「山田」「川瀬」というわりとよく見かける名字ならば読めるんですが、「東」に「あずま」という読みがあるとは知らなかったし、普段、目にしない人名用漢字もありますね。大変です・・・。