An alternative phonemic transcription of Korean

There is never only one way to analyze the phonological structure of a language. The beauty of phonemic transcriptions is that one is allowed to be quite abstract in this analysis. For Korean, I’ve sketched out my idea for the phonemic transcription in the page IPA transcription of Korean, but it is possible to simplify this further by reducing the number of basic sounds in the inventory. Here I consider a more abstract, even minimalistic phonemic transcription of Korean.

Vowels and glides

In the phonemic transcription used elsewhere in this site, the following symbols are used for the vowels and glides of Korean: vowels: a ɛ ʌ e o ø u y ɯ i glides: j w ɰ The correspondence with hangul (Korean alphabet) orthography is as follows: ㅏ a / ㅐ ɛ / ㅑ ja / ㅒ / ㅓ ʌ / ㅔ e / ㅕ / ㅖ je / ㅗ o / ㅘ wa / ㅙ / ㅚ ø / ㅛ jo / ㅜ u / ㅝ / ㅞ we / ㅟ y / ㅠ ju / ㅡ ɯ / ㅢ ɰi / ㅣ i One way to reduce the number of basic symbols is to look at the design logic of the hangul symbols. For instance, ㅐ ae /ɛ/ was originally a combination of ㅏ a /a/ and ㅣ i /i/, and originally represented a falling diphthong. We can treat such historical diphthongs as sequences of vowels plus the glide /j/, which gives the following: vowels: a ʌ o u ɯ i glides: j wa / ㅐ aj / ㅑ ja / ㅒ jaj / ㅓ ʌ / ㅔ ʌj / ㅕ / ㅖ jʌj / ㅗ o / ㅘ wa / ㅙ waj / ㅚ oj / ㅛ jo / ㅜ u / ㅝ / ㅞ wʌj / ㅟ uj / ㅠ ju / ㅡ ɯ / ㅢ ɯj / ㅣ i This reduces the number of vowel phonemes from ten to six, and the number of glide phonemes from three to two. We eliminate the need for the glide /ɰ/ by treating ㅢ ui as a vowel followed by a glide, /ɯj/, though today it is indeed pronounced as a glide followed by a vowel, /ɰi/. Similarly, ㅚ oe and ㅟ wi are written as /oj/ and  /uj/ respectively, though today they are overwhelmingly pronounced as glide-vowel sequences /we/ and /wi/ [ɥi] (though normative grammar still favours the conservative monophthongal pronunciations / and /y/ as the basic pronunciations, treating /we/ and /wi/ as optional variants). This minimalistic approach is good for giving a more systematic view of the vowel system of the normative conservative pronunciation of Korean. Instead of requiring the glide /ɰ/ that only ever appears in the combination /ɰi/, we can explain this combination along with various monophthongs or glide-vowel combinations as the results of an underlying vowel and the glide /j/, which can be attached to any of the vowels except for /i/. However, because this phonological analysis is based on historical pronunciation and is very different from the pronunciation of today’s Korean, it would be very confusing for anyone who is not already familiar with the sounds of today’s Korean and has some awareness of the historical sound changes of Korean. Furthermore, today’s Korean is going through some changes such as the merger of ㅐ ae /ɛ/ and ㅔ e /e/ (or /aj/ and /ʌj/ in the minimalistic analysis we are discussing), the systematic nature of this analysis will continue to be eroded.


The phonemic transcription used elsewhere in the site recognizes nineteen consonant phonemes: consonants: m b p pʰ n d t tʰ l z̥ʰ s ʣʲ ʦʲ ʦʲʰ ŋ ɡ k kʰ hɡ / ㄲ k / ㄴ n / ㄷ d / ㄸ t / ㄹ l / ㅁ m / ㅂ b / ㅃ p / ㅅ z̥ʰ / ㅆ s / ㅇ ŋ / ㅈ ʣʲ / ㅉ ʦʲ / ㅊ ʦʲʰ / ㅋ / ㅌ / ㅍ / ㅎ h We can be much more economical, treating the fortis series of stops and affricates as geminates of the plain series and the aspirated series as clusters of the plain series and /h/. Then we can reduce the number of consonant phonemes from nineteen to just ten, slashing it nearly in half: consonants: m p n t l s ʦ ŋ k hk / ㄲ kk / ㄴ n / ㄷ t / ㄸ tt / ㄹ l / ㅁ m / ㅂ p / ㅃ pp / ㅅ s / ㅆ ss / ㅇ ŋ / ㅈ ʦ / ㅉ ʦʦ / ㅊ ʦh / ㅋ kh / ㅌ th / ㅍ ph / ㅎ h I first though of using the voiced symbols /b, d, z, ʣ, ɡ/ for the stops and affricates, but decided not to make it too alien and settled on the voiceless symbols /p, t, s, ʦ, k/ instead. And since we’ve already stepped too far into the realm of phonemic abstraction, I’ve stripped away the various diacritics for phonetic details from the phonemic symbols, writing /s, ʦ/ instead of /z̥ʰ, ʣʲ/. To put it bluntly, these phonemic transcriptions are not meant to give information directly about the pronunciation at all, just the underlying structure of the sound system of the language that may give rise to the pronunciation.


Let’s see this alternative phonemic transcription in action, and for fun, let’s give both the morphophonemic representation that is closer to the spelling and a form that is closer to the surface pronunciation. We can write /ʔ/ for fortition that is not reflected in the spelling. Here we give the alternative phonemic transcription between bold slashes (/ /), followed by the more conventional phonemic (/ /) and phonetic ([ ]) transcriptions used elsewhere on the site.

  • 꺾쇠[꺽쐬/꺽쒜] kkeoksoe /kkʌkksoj → kkʌksoj/ /kʌɡ.sø/ [kʌk.sø, -swe]
  • 먹히다[머키-] meokida /mʌkhita/ /mʌ.kʰi.da/ [mʌ.kʰi.da]
  • 사과 sagwa /sakwa/ /z̥ʰa.ɡwa/ [z̥ʰa.ɡwa]
  • 아빠 appa /appa/ / []
  • 채찍 chaejjik /ʦhajʦʦik/ /ʦʰɛ.ʦiɡ/ [ʦʰɛʦ.ʦik]
  • 폈다[펻ː따] pyeotda /phjʌːss-ta → phjʌːt-ta/ /pʰjʌːd.ta/ [pʰjəːt.ta]
  • 필승[-씅] pilseung  /philʔsɯŋ → philssɯŋ/ /pʰil.sɯŋ/ [pʰil.sɯŋ]

One advantage is that it is somewhat easier to see some of the logic behind contractions and regular sound rules:

  • 아니하고 anihago /anihako/ /ɡo/ [ɦa.ɡo]
  • 않고[안코] anko /anhko → ankho/ /an.kʰo/ [an.kʰo]
  • 하였다[-엳따] hayeotda  /hajʌss-ta → hajʌt-ta/ /ha.jʌd.ta/ [ha.jʌt.ta]
  • 했다[핻ː따] haetda  /haːjss-ta → haːjt-ta/ /hɛd.ta/ [hɛt.ta]

For example, it is easier to see why /anihako/ contracts to /anhko/, or why the latter turns into /ankho/ through simple metathesis. This can be slightly more obscure if we just say that  /ɡo/ contracts into /an.kʰo/. Granted, this isn’t much of a difference, but it could be helpful in thinking about the phonology of Korean. In fact, if you are acquainted with the Yale romanization of Korean, then this alternative scheme of phonemic transcription should be familiar. The logic of the Yale romanization, which is used extensively in linguistics, is similar to this analysis. For example, the examples given above would be written in Yale romanization as follows: 꺾쇠 kkekksoy, 먹히다 mekhita, 사과 sakwa, 아빠 appa, 채찍 chayccik, 폈다 phyessta, 필승 philqsung, 아니하고 anihako, 않고 anhko, 하였다 hayessta, 했다 hayssta. The Yale romanization goes even further in the simplification of the vowel inventory, by treating the back rounded vowels ㅗ /o/ wo and ㅜ /u/ wu not as basic vowels but as combinations of the glide /w/ and the basic vowels ㆍ /ɒ/ o and ㅡ /ɯ/ u. The vowel phoneme ㆍ /ɒ/ is no longer used in Standard Korean and does not figure into the phonemic analysis above. This means that the implicit system of the Yale romanization is as follows, at least if we replace our /o, u/ above with /wɒ, wɯ/: vowels: a ʌ ɒ ɯ i glides: j wa / ㅐ aj / ㅑ ja / ㅒ jaj / ㅓ ʌ / ㅔ ʌj / ㅕ / ㅖ jʌj / ㅗ / ㅘ wa / ㅙ waj / ㅚ wɒj / ㅛ jwɒ / ㅜ  / ㅝ / ㅞ wʌj / ㅟ wɯj / ㅠ jwɯ / ㅡ ɯ / ㅢ ɯj / ㅣ i But the Yale romanization actually writes ㅛ as yo instead of ywo, ㅠ as yu instead of ywu, and ㅟ as wi instead of wuy (this last bit would imply that ㅟ should be analyzed as /wi/ instead of /uj/—this raises an interesting question of which is more historically correct, to which I don’t have the full answer). The priority seems to have been to use as few letters as possible without creating ambiguities rather than strict internal consistency (indeed, for modern Korean where ㆍ /ɒ/ isn’t used, the Yale romanization simply writes ㅗ as o instead of wo). The Yale romanization’s analysis with five basic vowels was probably forced by the restriction of having only five basic vowel letters in the Roman alphabet, with y being chosen to represent a glide, rather than by the nature of the Korean sound system itself. The alternative phonemic analysis discussed in this post is much too abstract and quite removed from the surface pronunciation of Korean, so it won’t be of much use when the goal is simply to describe how something is pronounced in Korean. The phonemic transcriptions on this site are aimed at straying not too far from the phonetic transcriptions. But it is possible that the exact level of phonemic analysis may be reviewed in the future, and we may incorporate some of the ideas here, though not all.

The pronunciation of Ban Ki-moon in Korean

In this post, we will illustrate the IPA transcription system for Korean used in this site with the example of the name of the United Nations Secretary-General Ban Ki-moon.

Ban Ki-moon is written 반기문 in hangul, the Korean alphabet, and 潘基文 in hanja, the Chinese characters used in Korean with nativized Korean pronunciations. The vast majority of Korean given names are traditionally chosen so that they can be written in hanja, but there are exceptions such as 하늘 Haneul /ha.nɯl/ from the native Korean word for “sky”. In this case, the phonetic transcription is also [ha.nɯl], and we henceforth omit the phonetic transcription in square brackets ([ ]) if it is identical to the phonemic transcription in slashes (/ /).

On their own, the surname 반 潘 Ban is pronounced /ban/ [b̥an] and the given name 기문 基文 Ki-moon is pronounced /ɡi.mun/ [ɡ̊i.mun]. Both the surname and given name are pronounced as they are written in Korean, and ㅂ, ㅏ, and ㄴ correspond to /b/, /a/, and /n/ respectively while ㄱ, ㅣ, ㅁ, ㅜ, and ㄴ correspond to /ɡ/, /i/, /m/, /u/, and /n/ respectively. Not all Korean names or words are pronounced as written because of morphophonemic spelling and sandhi effects—for example, 꽃 kkot |koʦʲʰ| is pronounced as if written [꼳] /kod/ [kot] and 종로 Jongno |ʣʲoŋ.lo| is pronounced as if written [종노] /ʣʲoŋ.no/ [ʣ̥ʲoŋ.no]. Korean dictionaries generally include these pronunciations where they differ from spelling. Here I have included the more abstract morphophonemic transcriptions that are closer to the spelling in pipes (| |).

The phonemes /b, ɡ/ are devoiced to [b̥, ɡ̊] initially. The ring diacritic indicates voicelessness in the IPA. Since [b] and [ɡ] are the symbols for the voiced bilabial stop and the voiced velar stop respectively, one might think that [b̥, ɡ̊] mean the same thing as [p, k], the usual IPA symbols for the voiceless bilabial stop and the voiceless velar stop respectively. But this is actually a shorthand way of expressing that there are differences in pronunciation between the pairs, just not one of voice.

Initial ㅂ  /b/ [b̥] and ㄱ /ɡ/ [ɡ̊] are produced with much less force than ㅃ /p/ [p] and ㄲ /k/ [k]. The latter pair are more prominent because they generally make the following vowel louder and higher in pitch, at least in initial position. So /b, ɡ/ and /p, k/ are distinguished in initial position in Korean even though both pairs are voiceless, similarly to how in English /b, ɡ/ and /p, k/ can still (barely) be distinguished when whispering, even though whispering involves devoicing all sounds that are normally voiced. Writing the word-initial allophones of /b, ɡ/ as [b̥, ɡ̊] has the advantage of using the same basic symbols as the underlying phonemes.

Now, Koreans are generally not referred only by their surnames in Korean but by their full name, given the relative paucity of distinctive Korean surnames. 반기문 Ban Ki-moon /ban ɡi.mun/ then becomes [b̥an.ɡi.mun], pronounced as a single unit. The /ɡ/ of 기문 Ki-moon /ɡi.mun/ maintains its voicing as it is surrounded by voiced sounds /n/ and /i/. In less careful speech, we may in fact also hear [b̥aŋ.ɡi.mun], but this sort of place assimilation where /n/ becomes [ŋ] in front of velar stops is considered nonstandard.

If each of the syllables were being pronounced separately for emphasis, then we would have [b̥an|ɡ̊i|mun] with /ɡ/ devoiced to [ɡ̊]. The pipe (|) is used here to mark the prosodic breaks.

Other names may involve even more striking differences depending on whether the surname and given name are pronounced together or separately. Consider 박목월[방-] 朴木月 Park Mokwol /baɡ moɡ.wʌl/ [b̥aŋ.mo.ɡwʌl], where the coda /ɡ/ of the surname 박 (/baɡ/ [b̥ak] on its own) becomes the nasal [ŋ] due to the following /m/ when the full name is pronounced as a single unit, as if it were the surname 방 方/邦/房/龐 Bang /baŋ/ [b̥aŋ].

Furthermore, in romanizing Korean names, each syllable tends to be transcribed based on its pronunciation on its own, hence Mokwol instead of Mogwol for 목월 /moɡ.wʌl/ [mo.ɡwʌl]. Since it is useful to show how each of the syllables of the surnames and given names are pronounced separately as well as together, we will transcribe them as follows when a difference arises:

  • 반기문 /ban ɡi.mun/ [b̥an|ɡ̊i|mun → b̥an.ɡi.mun]
  • 박목월[방-] /baɡ moɡ.wʌl/ [b̥ak|mok|wʌl → b̥aŋ.mo.ɡwʌl]

The name Ban Ki-moon is invariably given in the Korean order, where the surname (family name) Ban comes before the given name Ki-moon. Other Korean names may be conventionally known in the Western order with the given name first, e.g. Syngman Rhee 이승만 李承晩 /iː z̥ʰɯŋ.man/ where Rhee is the surname, which is more commonly written Lee for other bearers of the same surname. Yet other names can be seen in both orders, e.g. Ji-Sung Park or Park Ji-sung 박지성[-찌-] 朴智星 /baɡ ʣʲi.z̥ʰʌŋ/ [b̥ak|ʣ̥ʲi|z̥ʰʌŋ → b̥ak.ʦʲi.z̥ʰʌŋ] where Park is the surname.

로제타와 필레: 고대 이집트 지명에서 이름을 딴 혜성 탐사선

2014년 11월 유럽우주국(ESA)의 혜성 탐사선 로제타(Rosetta) 호에 실린 탐사 로봇 필레(Philae)가 추류모프·게라시멘코(Churyumov–Gerasimenko) 혜성에 착륙하는데 성공했다.

국립국어원과 한국신문방송편집인협회가 공동 주관하는 정부·언론 외래어 심의 공동위원회(이하 외심위)에서는 시사성이 있는 외래어의 규범 표기를 신속하게 결정하기 위해 정기적으로 실무소위원회를 갖는다. ‘로제타’와 ‘추류모프·게라시멘코 혜성’은 2014년 11월 24일 발표한 2014년도 제31차 실무소위원회 결정 사항 가운데 포함되었으나 언론에서 ‘필레이’, ‘필라이’, ‘필레’로 다양하게 쓰던 탐사 로봇 Philae의 표기는 의견이 모아지지 않아 외심위 본회의로 넘어가게 되었고 2014년 12월 3일 제118차 정부·언론 외래어 심의 공동위원회 본회의에서 비로소 ‘필레’로 결정되었다.

로제타 호는 이집트 상형문자의 해독에 결정적인 실마리가 된 ‘로제타 석’에서 이름을 땄다. 로제타 석은 두 종류의 이집트 문자와 그리스 문자가 함께 적힌 비문으로 ‘로제타’라는 곳에서 발견되었다. 아랍어로는 라시드(رشيد‎ Rašīd ar[ra.ʃiːd])로 불리는 지명을 이탈리아어로는 Rosetta it[ro.ˈzet.ta] DiPI ‘로세타’로 부르는데 이것을 영어에서 그대로 따온 것으로 ‘로제타’라는 한글 표기는 영어 발음 en[roʊ̯.ˈzɛt̬.ə] EPD, LPD 를 따른 것이다. 오늘날의 표준 이탈리아어 발음에서 동일 형태소 내부의 모음 사이 s는 [z]로 발음되지만 외래어 표기법에서는 ‘ㅅ’으로 적기 때문에 Rosetta에 이탈리아어 표기법을 적용하면 ‘로제타’가 아니라 ‘로세타’가 된다. 이탈리아어에서 모음 사이의 s는 [s] 또는 [z]로 발음되는데 그 분포는 전통 발음과 오늘날의 발음에 따라 다르고 지역에 따라도 차이가 나며 여러 단어에서 [s][z]가 둘 다 가능하기 때문에 외래어 표기법에서는 철자 s를 언제나 ‘ㅅ’으로 통일해서 적는다. 프랑스어로는 Rosette fr[ʁɔ.zɛtₔ] ‘로제트’ DPF, 독일어로는 Rosette de[ʁo.ˈzɛt.ə] Duden, DAw ‘로제테’ 또는 de[ʁo.ˈzɛt] Duden ‘로제트’로 부른다.

혜성 착륙 모듈 필레도 마찬가지로 이집트 상형문자의 해독에 도움을 준 ‘필레 오벨리스크’에서 이름을 딴 것이다. 이 오벨리스크가 발견된 필레는 고대 이집트의 사원을 포함한 유적지가 있는 나일 강의 섬이다. 고대 그리스어로 Φίλαι (Phílai) ‘필라이’라고 했고 Philae ‘필라이’는 여기에서 따온 라틴어명이다. 그리스어와 라틴어의 한글 표기에 대한 규정은 지금까지 고시된 외래어 표기법에 포함되어 있지 않지만 1986년 외래어 표기법이 제정된 후 발간된 《외래어 표기 용례집(지명·인명)》의 ‘일러두기’란에 ‘라틴어의 표기 원칙’과 ‘그리스어의 표기 원칙’이 포함되었으며 국립국어원은 2007년경 그리스어의 표기를 고전 그리스어와 현대 그리스어로 나누어 더 자세하게 다루는 그리스어 표기법 시안을 마련하기도 했다. 이들은 정식으로 고시된 것은 아니지만 국립국어원에서 그리스어와 라틴어의 표기를 심의할 때 따르므로 외래어 표기법에 준하는 지위를 갖는다.

라틴어의 표기 원칙에서 ae는 ‘아이’로 적도록 하고 있다. 이는 ae가 고전 라틴어 발음에서 이중모음을 나타내었기 때문인데 Aëtius ‘아에티우스’, Laërtes ‘라에르테스’, Danaë ‘다나에’처럼 a와 e가 독립적으로 발음될 때는 물론 ‘아에’로 적어야 할 것이다(본 사이트에서는 혼동을 피하기 위해 라틴어의 ae가 이중모음이 아닐 경우 aë로 적는다). 고대 그리스어의 αι (ai)도 ‘아이’로 적는다. 그러니 Philae를 라틴어 이름으로 보면 ‘필라이’로 적어야 하며 고대 그리스어 이름인 Φιλαί (Philaí)도 ‘필라이’로 적는 것이 맞다. 그런데 왜 외심위에서는 ‘필레’로 표기를 정했을까?

먼저 라틴어의 ae를 왜 ‘아이’로 적는지부터 살펴보자. 초기 라틴어(기원전 75년 이전)에서는 ae에 해당하는 음을 ai로 적었으며 이에 따라 발음은 [ai̯]로 재구성하는 것이 가능하다. 이것이 고전 라틴어에 와서는 철자가 ae로 바뀌었는데 발음은 [aɛ̯] 정도였을 것이다. [i] 같은 고모음부로 끝나는 이중모음은 덜 분명하게 발음하면 [i]를 못 미치고 [e][ɛ] 정도에서 끝날 수 있는데 라틴어의 발음은 이런 식의 변화를 겪은 듯하다. 영어와 독일어의 이중모음 [aɪ̯]도 실제 발음은 [ɪ]에 못 미친다며 정밀 전사에서는 [ae̯][aɛ̯]로 적는 이들도 있다. 예를 들어 독일어 발음 사전인 DAw[aɛ̯]를 쓴다. 그러니 고전 라틴어의 [aɛ̯]는 우리가 ‘아이’로 적는 영어와 독일어의 [aɪ̯]와 크게 차이가 나지 않았을 것이다. 또 영어로 된 고전 라틴어 발음 설명에서는 흔히 ae의 발음을 영어의 [aɪ̯]로 묘사한다는 것도 라틴어의 ae를 ‘아이’로 쓰게 된 이유일 것이다.

그에 못지않게 중요한 점은 라틴어의 ae가 고대 그리스어에서 들어온 말에서 원어의 이중모음 αι (ai)를 적기 위해 쓰였다는 것이다. 그리스 문자의 ‘알파’ α (a)는 따로 쓰일 때 [a], ‘요타’ ι (i)는 따로 쓰일 때 [i]를 나타낸다. 고전 시기(기원전 5~4세기)의 그리스어에서 αι (ai)는 [ai̯] 정도의 이중모음을 나타낸 것으로 보인다. 고전 시기 이후에는 대체로 단순모음으로 발음하게 되었지만 후대에도 고전 그리스어를 흉내낸 학구적인 발음에서는 원래의 이중모음 발음을 의도적으로 유지한 것으로 보인다. 기원전 146년 코린트 전투를 기점으로 로마가 그리스를 지배하기 시작하면서 그리스의 문화, 특히 수세기 전의 고전 그리스 문화를 적극적으로 수용한 로마의 엘리트 계층은 이런 보수적인 학구적 발음을 배웠기 때문에 그리스어의 αι (ai)를 라틴어의 ae로 받아들였을 것이다.

고대 그리스어의 표기 원칙은 사실 실제 그리스어에서 쓰였던 발음을 나타낸 것으로는 설명이 되지 않는다. 고전 시기 직후에 이미 단순모음으로 발음하기 시작하여 로마 시대 초에는 완전히 단순모음으로만 변한 αι (ai)는 ‘아이’로 적으면서 수세기가 지난 중세 그리스어에서야 [y]에서 [i]로 변한 ‘입실론’ υ (u)는 ‘이’로 적는 것은 모순으로 보인다. 즉 αι (ai)를 ‘아이’로 적는다면 υ (u)는 ‘위’로 적고 υ (u)를 ‘이’로 적는다면 αι (ai)는 ‘에’로 적어야 앞뒤가 맞는다. 그러나 고대 그리스어의 표기 원칙은 고전 라틴어에서 고대 그리스어를 받아들일 때 쓴 발음을 나타낸 것으로 이해하면 수수께끼가 풀린다.

당시 υ (u)의 그리스어 발음은 원순모음 [y]였으나 라틴어에는 [y] 음이 없었다. 원래는 υ (u)의 그리스어 발음이 [u]에 더 가까웠기 때문에 초기 라틴어에서는 이를 u로 흔히 적었지만 그리스어 발음이 [y]로 바뀌고 난 후에 로마인들은 그리스어에서 차용한 어휘에서 이 음을 적기 위해 새로운 글자인 y를 도입했다. 당시에는 소문자가 없었고 u와 v의 구분이 없었으므로 여기서 말하는 u는 V, y는 Y이다. 이렇게 해서 라틴 문자의 일부가 된 대문자 Y는 그리스 문자에서 입실론 υ (u)의 대문자 Υ와 형태가 같다.

그리스어를 배운 로마의 엘리트 층은 그리스어에서 차용한 어휘에서 y를 [y]로 발음했겠지만 원래 라틴어에서 쓰이던 음이 아니다보니 보통 [i]로 발음하는 일이 많았다. 그러니 그리스어를 외국어로 배운 라틴어 화자들 가운데는 αι (ai)는 ‘아이’와 비슷한 이중모음으로 발음하면서 υ (u)는 ‘이’와 비슷한 비원순 모음으로 발음한 이들이 있었을 것이다. 따라서 고대 그리스어의 표기 원칙은 이런 이들의 그리스어 발음, 즉 라틴어의 음운 체계에 맞게 단순화시킨 고전 시기 이후의 학구적 그리스어 발음을 따른 것이라고 결론을 내릴 수 있다.

Φίλαι (Phílai)의 기원전 5세기경 고전 아티카 발음은 grc[ˈpʰí.lai̯] 정도였을 것이다(아테네가 속한 아티카 지방의 방언이 가장 영향력이 컸다). 로마의 엘리트 계층이 배운 학구적 발음도 비슷했을 것이다. 이는 고전 라틴어에서 Philae la[ˈpʰi.laɛ̯]가 되었다.

그런데 이미 언급한대로 그리스어의 αι (ai)는 고전 시기 이후에 단순모음으로 바뀌어 [ɛ]를 거쳐 [e]로 발음이 변했다. 그래서 기원전 1세기 초 이집트 알렉산드리아에서 쓰인 코이네 그리스어 발음에서 Φίλαι (Phílai)는 grc[ˈpʰi.lɛ]가 되었고 오늘날의 현대 그리스어에서 Φίλαι (Filai)는 el[ˈfi.le]로 발음한다. 그리스어 표기법 시안에서도 현대 그리스어의 Φίλαι (Filai)는 ‘필레’로 적는다.

라틴어에서도 원래 이중모음을 나타내던 ae는 속라틴어에서부터 시작하여 고전 후기(3~6세기경)에는 [ɛ]로 발음이 바뀌었다. 그래서 중세 라틴어와 르네상스 이후의 신라틴어에서는 원래의 ae를 e로 쓰는 경우가 많았다. 혹은 æ로 적기도 한다. 생물학에서 쓰이는 학명 등 과학 분야에서 쓰이는 라틴어는 신라틴어 발음을 기준으로 하는 것이 보통이다. 예를 들어 지질 시대인 팔레오세의 ‘팔레오’는 고대 그리스어의 παλαιός (palaiós)에서 온 신라틴어 접두사 palaeo-에 해당한다.

외래어 표기 용례를 보면 Palestina를 ‘팔레스티나’로 적고 라틴어 표기법을 따른 것으로 표시한 것이 보인다. 그러나 고대 그리스어의 Παλαιστίνη (Palaistínē) ‘팔라이스티네’에서 유래한 이 지명은 고전 라틴어로 Palaestina ‘팔라이스티나’라고 했으며 Palestina는 신라틴어 형태이다. 지금은 영어 이름인 Palestine en[ˈpæl.ᵻ.staɪ̯n] EPD, LPD 의 통용 표기인 ‘팔레스타인’을 주로 쓴다(외래어 표기법을 적용하면 원래 ‘팰리스타인’으로 쓰는 것이 원칙이나 ‘팔레스타인’을 관용 표기로 인정한다). 또 라틴어 표기법을 따랐다고 명시하지는 않지만 고대 그리스어의 Αἰθιοπία (Aithiopía) ‘아이티오피아’에서 유래한 국명 Ethiopia는 ‘에티오피아’로 적는다. 고전 라틴어로는 Aethiopia ‘아이티오피아’라고 했다.

외래어 표기 용례 중에 원 철자를 ae로 주면서 신라틴어 발음을 따라 ‘에’로 적은 예는 이보다도 많다. 고대 그리스어의 Ἀθῆναι (Athênai)에서 온 라틴어 Athenae는 ‘아테네’로, Θῆβαι (Thêbai)에서 온 Thebae는 ‘테베’로, Μυκῆναι (Mukênai)에서 온 Mycenae는 ‘미케네’로, Θερμοπύλαι (Thermopúlai)에서 온 Thermopylae는 ‘테르모필레’로, Νίκαια (Níkaia)에서 온 Nicaea는 ‘니케아’로, Ἀχαιμένης (Akhaiménēs)에서 온 Achaemenes는 ‘아케메네스’로 적는다. 원어를 영어인 Aegean으로 표시한 ‘에게 해’도 Αἰγαί (Aigaí)에서 온 Aegae를 원어로 본다면 여기에 포함시킬 수 있다.

참고로 테베는 그리스의 지명이자 오늘날 룩소르의 일부에 해당하는 이집트의 고대 도시 이름이기도 한데 이와 같이 고대 이집트의 지명은 고대 그리스어 이름에서 온 라틴어 이름의 형태로 알려진 것이 많다. 이집트 고왕국의 수도였던 Memphis ‘멤피스’는 Μέμφις (Mémphis) ‘멤피스’에서 왔고 알렉산드로스 대왕이 세운 Alexandria ‘알렉산드리아’는 Ἀλεξάνδρεια (Aleksándreia) ‘알렉산드레(이)아’에서, 카이로의 북서쪽에 있는 Heliopolis ‘헬리오폴리스’는 Ἡλιούπολις (Hēlioúpolis) ‘헬리우폴리스’에서, 아스완의 유적지 Elephantine ‘엘레판티네’ 섬은 Ελεφαντίνη (Elephantínē) ‘엘레판티네’에서 왔다.

국명인 에티오피아와 그리스의 수도인 아테네를 비롯한 정착된지 오래되고 지명도가 높은 이름에서 라틴어의 ae를 ‘에’로 적는 경우가 많다. 그도 그럴 것이 ae를 단순모음으로 발음한 속라틴어로부터 발달한 로망 제어(이탈리아어, 에스파냐어, 프랑스어 등)는 물론 현대 유럽의 언어에서는 하나같이 고전 라틴어의 ae에 해당하는 음을 전통적으로 단순모음으로 발음하기 때문이다. 예를 들어 이탈리아어로 아테네는 Atene it[a.ˈtɛː.ne] DiPI ‘아테네’, 테베는 Tebe it[ˈtɛː.be] DiPI ‘테베’이다. 고전 라틴어 발음을 따른다고 ae를 ‘아이’로 적기 시작한 것은 비교적 최근의 일이라서 Caesar ‘카이사르’ 등 고대 로마와 관련된 어휘는 표기가 많이 바뀌었지만 고대 로마와 직접적인 관련이 없는 인명과 지명은 ae를 ‘에’로 적던 기존의 표기를 그대로 둔 것이 대부분이다.

Philae의 경우 이탈리아어로는 File it[ˈfiː.le] DiPI ‘필레’, 독일어로는 Philae de[ˈfiː.lɛ] DAw 또는 Philä de[ˈfiː.lɛ] Duden ‘필레’, 프랑스어로는 Philæ fr[fi.le] DPF ‘필레’로 부른다. 영어에서는 전통적으로 Philae en[ˈfaɪ̯l.iː] MWGD ‘파일리’로 부르지만 Philae 자체가 잘 알려진 이름이 아니라서 일반인들에게는 무척 생소한 발음이다. 영어는 대모음 추이의 결과로 라틴어에서 온 이름을 전통적으로 발음하는 방식이 다른 유럽 언어에 비해 원래의 라틴어 발음에서 상당히 멀어져 철자만 보고 라틴어계 어휘의 발음을 짐작하는 것이 꽤 까다롭다. 그래서인지 혜성 착륙 시도를 보도한 방송에서는 물론 유럽우주국 직원들도 다른 유럽 언어에서 쓰이는 발음을 흉내내어 영어로 en[ˈfiːl.eɪ̯] ‘필레이’로 흔히 발음하는 듯하다. 영어에서는 어말에 [ɛ]가 올 수 없으므로 한글로 ‘필레’로 적는 발음은 영어로 불가능하다.

유럽우주국의 본부는 프랑스 파리에 있으며 관제 센터는 독일 다름슈타트에 있다. 유럽우주국의 공용어는 영어, 프랑스어, 독일어이며 탐사 로봇 필레의 제작에는 네덜란드, 독일, 벨기에, 스위스, 아일랜드, 에스파냐, 영국, 오스트리아, 이탈리아, 캐나다, 폴란드, 프랑스, 핀란드, 헝가리가 참여했다. 그러니 특별히 Philae의 영어 발음을 기준으로 할 필요는 없고 프랑스어와 독일어에서 쓰는 발음에 따른 표기가 ‘필레’라는 것이 외심위의 최종 결정에 영향을 끼쳤을 수가 있다.

참고로 미 항공우주국의 Apollo ‘아폴로’ 계획은 영어 발음인 en[ə.ˈpɒl.oʊ̯] EPD, LPD 에 따르면 ‘어폴로’ 계획으로 써야 하니 ‘아폴로’는 라틴어 이름으로 본 표기가 아닌가 생각할 수 있다. 그러나 이 표기는 현행 외래어 표기법 제정 이전인 1960~70년대 당시 썼던 것을 그대로 인정한 것으로 원래 영어 대신 라틴어 발음을 고려해서 정한 표기였다고 보기 어렵다. Apollo는 그리스 신화에 나오는 신 Ἀπόλλων (Apóllōn) ‘아폴론’을 로마 신화에도 그대로 받아들이면서 쓴 라틴어 이름이다.

지금까지 여러 언어에서 쓰이는 Philae의 발음을 살펴보았는데 한글 표기는 어느 언어의 발음을 기준으로 해야 할까? 먼저 이집트의 지명으로서의 Philae부터 살펴보자.

외래어 표기법에서 지명의 표기는 원지음을 따르는 것을 원칙으로 하되 제3국의 발음으로 통용되고 있는 것은 관용을 따르도록 한다. 오늘날 이집트는 아랍어 사용국이므로 Philae는 현지어 이름이 아니다(아랍어 이름은 فيله‎ Fīlah ar[fiː.la] ‘필라’이다). 국제적으로 통용되는 이름은 영어의 Philae ‘파일리’, 독일어의 Philae/Philä ‘필레’, 프랑스어의 Philæ ‘필레’, 이탈리아어의 File ‘필레’ 등 라틴어의 Philae ‘필라이’에서 기원한 것들이다. 물론 현대 그리스어 Φίλαι (Filai) ‘필레’는 라틴어를 거치지 않은 고대 그리스어의 Φίλαι (Phílai) ‘필라이’의 직계손인데 그리스어 표기 시안을 보면 지명은 원칙적으로 현대 그리스어 표기법을 적용하게 되어있으니 그리스어로 표기한다 해도 ‘필레’가 맞다. 그러니 영어를 제외한 여러 언어에서 Philae 및 그 변형들은 한글로는 ‘필레’로 표기된다. Philae를 ‘필레’로 적는 것은 아테네, 테베, 미케네 등의 신라틴어식 표기 방식과도 일치한다. 그러니 이집트의 지명 Philae는 ‘필레’로 적을만한 근거가 충분하다.

로제타 호가 지명 로제타의 한글 표기를 그대로 따른 것처럼 지명 Philae를 따른 탐사 로봇도 같은 한글 표기를 쓰는 것이 좋을 것이다. 그러나 지명의 표기를 잠시 제쳐두고 탐사 로봇의 이름 표기만 생각해보자. 우선 라틴어 이름으로 보고 표기한다면 실제 외래어 표기 용례에서 라틴어의 표기 원칙의 적용 범위는 고대 로마 관련된 표기에 한정되고 과학 분야에서 쓰이는 라틴어는 이에 포함이 되지 않는다는 것을 주목할만하다. 과학 분야의 라틴어는 고전 라틴어 발음이 아니라 신라틴어 발음을 따르는 것이 자연스럽다. 그리고 유럽우주국의 세 공용어 가운데 프랑스어와 독일어를 기준으로 해도 ‘필레’이고 심지어 영어에서도 Philae의 전통적 발음인 ‘파일리’ 대신 프랑스어와 독일어 발음을 흉내낸 ‘필레이’를 흔히 쓴다는 점이 탐사 로봇의 표기를 ‘필레’로 정하는 과정에서 고려되었을 수 있다.

외심위의 결정은 탐사 로봇의 이름인 Philae을 ‘필레’로 표기한다는 것이지 그 이름의 근원인 이집트의 지명 Philae의 표기에 대한 언급은 없다. 하지만 이미 살펴본 바와 같이 지명 Philae도 ‘필레’로 적는 것이 합리적이다.

헬로, 월드!

본 블로그에 오신 것을 환영합니다. 여러 언어의 발음과 그 전사 방법을 다루기 위한 공간으로 만들었습니다. 특히 외래어 표기법에 입각하여 외국어를 발음에 따라 어떻게 한글로 표기할지의 문제를 다루고자 합니다. 주제에 따라 영어 또는 한국어로 글을 쓰려 합니다. 한국어로 글을 쓸 때는 편의상 본 소개글을 제외하고 높임말을 생략한 문어체로 쓰겠습니다.

‘헬로, 월드!’는 영어 Hello, world!를 외래어 표기법에 따라 한글로 적은 것입니다. 프로그래밍 언어를 배우면 보통 Hello, world!를 출력하는 것이 첫번째 예제입니다. 직역하면 ‘세상아, 안녕!’ 정도가 되겠지만 한국어로는 어색한 탓인지 보통 번역하지 않고 씁니다(‘반갑다 세상아!’로 쓰면 더 나을지 모르겠습니다). 영어로 쓴 저번 글에 더 자세히 나와있는 것처럼 국제 음성 기호(IPA)로 적으면 hello는 [hə.ˈloʊ̯, hɛ.ˈloʊ̯, ˈhɛl.oʊ̯], world는 [ˈwɜrld]입니다.

대부분의 사전에서 hello의 발음은 [hə.ˈloʊ̯]를 우선시합니다. 여기에 외래어 표기법을 적용하면 ‘헐로’입니다. 그러나 여기서 첫 모음 [ə]는 원래의 [ɛ]가 약화된 모음입니다. 영어를 한글로 적을 때 모음이 약화되지 않은 발음과 약화된 발음이 공존하면 약화되지 않은 쪽을 기준으로 하는 것이 보통입니다. 따라서 hello는 ‘헐로’가 아니라 [hɛ.ˈloʊ̯, ˈhɛl.oʊ̯]를 기준으로 한 ‘헬로’로 적는 것이 자연스럽습니다.

1986년 제정된 외래어 표기법 고시본에서 쓰이는 영어 발음기호는 오늘날 주로 쓰는 방식과는 차이가 있습니다. 외래어 표기법 고시본에서는 대니얼 존스(Daniel Jones [ˈdæn.jəl.ˈʤoʊ̯nz])의 English Pronouncing Dictionary (EPD) 초판(1917년)에서 제12판까지 쓰인 방식을 따라서 영어의 장모음과 단모음은 장음 부호(ː)만으로 구별했습니다. 이 방식에서는 예를 들어 it [it], eat [iːt], odd [ɔd], awed [ɔːd]와 같이 썼습니다. 그러나 실제 영어 발음에서 it와 eat, odd와 awed는 단순히 모음의 길이의 차이가 아니라 음가의 차이로 구별되며, 특히 미국식 발음에서는 모음의 길이 구별이 상당 부분 사라졌으므로 장음 부호만으로는 영어의 장모음과 단모음을 제대로 나타내기에 부족하다는 비판이 일었습니다. 그래서 이런 현실을 반영하기 위해 A. C. 김슨(Gimson [ˈɡɪmps.ən])이 편집을 맡은 EPD 제14판(1977년)에서부터 it [ɪt], eat [iːt], odd [ɒd], awed [ɔːd]로 쓰는 등 장음 부호 뿐만이 아니라 장모음과 단모음에 쓰이는 기호 자체를 다르게 해서 구별했고, 오늘날에는 이것이 보편적인 영어 발음 표시 방식이 되었습니다. 이 이야기는 존 웰스(John Wells [ˈʤɒn.ˈwɛlz])의 “IPA transcription systems for English”라는 글에 더 자세히 나와있습니다.

외래어 표기법 고시본에 쓰인 옛 방식을 따르면 hello [hə.ˈloʊ̯, hɛ.ˈloʊ̯, ˈhɛl.oʊ̯][həlou, helou]이고 world [ˈwɜrld][wəːld]입니다. 음절 구분과 강세 표시는 생략하고 모음 앞 이외의 [r]는 발음하지 않는 영국 발음을 기준으로 표시하기 때문입니다.

Hello, world!

[hə.ˈloʊ̯.ˈwɜrld, ˈhɛl.oʊ̯.ˈwɜrld]

Welcome to the Pronouncer blog, where we will be discussing the pronunciation of various languages and the related issue of how to transcribe them in various forms, especially into the Korean alphabet. Posts will be in English or Korean depending on the subject matter.

We will be dealing with subjects such as phonetics, phonology, orthography, transliteration, and transcription. To represent the pronunciations, we will be relying heavily on the International Phonetic Alphabet, so make sure to gain some familiarity with it.

In the above, [hə.ˈloʊ̯.ˈwɜrld] is a diaphonic phonetic transcription of the English utterance “Hello, world”, which is to say that it is a single phonetic transcription that covers pronunciation in both Received Pronunciation (RP) and General American (GA) pronunciation, the representative accents of British and American English respectively. For a phonetic transcription of RP, we would generally transcribe GB[hə.ˈləʊ̯.ˈwɜːld] instead, to show that the diphthong diaphonically transcribed as [oʊ̯] has a more unrounded, central starting point, hence GB[əʊ̯]; and that underlying [r] is not pronounced unless it is immediately followed by a vowel, which is why we write GB[ɜː] instead of [ɜr]. This is because RP is a non-rhotic accent, unlike GA. For the rhotic GA pronunciation, we follow many pronunciation dictionaries in preferring to show the r-coloured vowel explicitly for the combination [ɜr], writing US[ɝː] instead, i.e. US[hə.ˈloʊ̯.ˈwɝːld].

In general, we give phonetic transcriptions enclosed in square brackets ([ ]). Phonetic transcriptions are simply representations of the speech sounds, and can be broad or narrow based on how much detail we want to go into. A phonemic transcription, which we enclose in slashes (/ /), is a special kind of broad transcription where the symbols we use correspond one-to-one to the phonemes of the language, that is, the atomic unit of the sounds of a language. This requires determining the structure of the pronunciation of the language to determine precisely what the phonemes are, i.e. a phonological analysis. Different analyses may disagree on whether one sound is a phoneme in its own right or simply a variant of another phoneme, and the inventory of phonemes also varies depending on the different varieties of the language. In our case, /hə.ˈloʊ̯.ˈwɜrld/ could be a perfectly serviceable phonemic transcription, but we prefer to give phonetic transcriptions in general for English because we want to capture some details in pronunciation without worrying about whether they are relevant to phonemic differences.

What about [ˈhɛl.oʊ̯.ˈwɜrld]? Well, the first thing to know is that “hello” has an alternative pronunciation, [hɛ.ˈloʊ̯], which is the same as [hə.ˈloʊ̯] except that the first vowel is unreduced. Here I follow Wikipedia in transcribing the vowel of DRESS as [ɛ], but many simply write [e] (e.g. [he.ˈloʊ̯]) since it is just as unambiguous—English doesn’t have two e-type vowels to distinguish—and is the simpler symbol typographically.

Now, [ˈhɛl.oʊ̯] is a variant pronunciation where the stress is on the first syllable, though it is not recognized in many dictionaries. It does appear as an American variant in the Cambridge English Pronouncing Dictionary, 18th ed. But even if stressing “hello” on the first syllable is rare when the word is pronounced on its own, it is a different story when a stressed syllable immediately follows. “Hello” then becomes susceptible to stress shift so that it is pronounced [ˈhɛl.oʊ̯], and this even becomes the usual pronunciation in examples such as Hello Kitty [ˈhɛl.oʊ̯.ˈkɪt̬.i]. That is why I write [ˈhɛl.oʊ̯.ˈwɜrld] as a possibility.

I think I would oscillate between the two pronunciations, tending to say [hə.ˈloʊ̯.ˈwɝːld] if I was actually greeting the world, but tending more to [ˈhɛl.oʊ̯.ˈwɜrld] if it is a set phrase, as in a “Hello, world!” program.