关于MySQL字段排序规则

2007年的时候,使用MySql5.5.x版本,发现一个问题:对于varchar字段(char估计一样),在选择utf8字符集时(后面新出来的utf8mb4一样),无法按中文拼音排序,即:排序规则中没有gbk_chinese_ci一项,而在选择gbk、gb2312、gb18030都有,这个问题一直没有找(想)到答案,因为后面的工作中使用SQL Server和Oracle居多。

今天再次出现这个问题,在网上找一遍资料后,回忆起当年的来龙去脉,逐渐想明白了其中原因:如果是选择中文字符集,比如GBK,那么数据库排序规则原则上只会考虑拉丁文和中文字符存在的可能,所以可以有中文排序规则可选;但是如果选择utf8等大的字符合集时,除了中文,还有其他语言字符存在,假如选择排序规则为中文拼音的话,其他语言字符如何排序呢?

mysql