본문 바로가기
공부/언어학개론

<언어학개론>제12장. 언어와 문학, 텍스트 장르와 문체-4. 텍스트 장르와 언어 특성 &제13장. 언어와 컴퓨터, 전산언어학-1. 전산언어학이란?

by springwintercoming 2020. 4. 20.

>>>앞의 글에서 이어집니다

https://winterlight.tistory.com/44

 

<언어학개론>제12장. 언어와 문학, 텍스트 장르와 문체-2. 은유&3. 만화의 언어

>>>앞의 글에서 이어집니다 https://winterlight.tistory.com/43 <언어학개론>제11장.언어와 사회:사회언어학-5. 언어의 접촉, 피진어와 크리올어 & 제12장. 언어와 >>>앞의 글에서 이어집니다 https://winterligh..

winterlight.tistory.com

 

 

******다음의 포스팅의 내용 중에서, 파란색 글씨로 된 내용을 제외한 검은색 글씨로 된 텍스트는 <언어 풀어쓴 언어학개론> (강범모, 한국문화사) 에서 가져온 부분임을 밝힙니다.(그대로 가져온 부분도 있지만 대부분은 본인의 스타일로 정리함)******

 

파란색으로 된 내용은 개인적인 의견 또는 스스로 알고 있는 것을 정리한 내용임

 

 

 

제12장. 언어와 문학, 텍스트 장르와 문체

 4. 텍스트 장르와 언어 특성

 

레지스터, 장르, 문체

 

  사람들이 언어를 사용하는 방법은 다양하다. 즉, 언어에는 변이(variation)가 있다. 이러한 변이성 및 다양성은 언어의 사용 상황의 차이에 따른 언어의 다양성을 지칭하는 레지스터(register, 사용역)와 언어를 사용하는 집단의 차이에 따르는 방언(dialect)으로 대별될 수 있다.

  레지스터와 관련되는 언어의 사용 상황은 여러 가지 요인을 포함한다. 언어를 사용하는 사람(남자, 여자, 아이, 어른 등), 언어 사용의 양식(구어, 문어), 매체(신문, 잡지, 전자출판물), 담화의 주제(인문, 사회, 자연, 일상생활), 그리고 언어 사용의 목적(정보 전달, 예술적 감흥) 등의 여러 가지 요인들이 그것들이다. 이와 같은 다양한 요인들은 상호 독립적이 아니라 서로 관련이 있다. 따라서 레지스터는 상황 요소의 모든 가능한 조합이 아니라 사회에서 반복적으로, 그리고 규칙적으로 발생하는 언어 사용 상황에 대응하는 언어 혹은 텍스트의 종류라고 할 수 있다. 텍스트 유형에 관하여 쓰이는 용어인 장르(genre)는 언어 사용의 목적과 좀 더 깊은 관계가 있다. 예를 들어, 소설, 시, 수필 등은 우리가 흔히 문학 장르라고 부르는 것들이다. 그러나 이 두가지(레지스터, 장르)가 모두 언어 사용 상황의 다양성이라는 면과 관련된다는 점을 고려한다면, 레지스터와 장르의 명확한 차이를 두지 않아도 될 것이다. '장르'는 언어 사용의 상황적 요인에 따른 텍스트의 종류라는 일반적 의미를 갖는다.

  텍스트에 나타나는 문법적 특성은 텍스트의 종류에 따라 다르게 나타난다. 예를 들어, 일인칭, 이인칭 대명사는 대화의 텍스트에 많이 나타나지만, 설명을 위주로 하는 학술논문에는 많이 나타나지 않는다. 또 과거 시제는 소설 등 서술적 텍스트에 많이 나타나지만 주장을 표현하는 신문 사설에서는 상대적으로 덜 나타난다. 따라서 텍스트에 나타나는 언어 특성만을 기준으로 여러 가지 텍스트 유형을 나눌 수 있다. 그러나 장르(레지스터)와 좁은 의미의 언어적 텍스트 유형이 전혀 별개의 독립적인 것은 아니다. 하나의 장르와 관련된 특정 상황에서 사용되는 말은 특정 언어 특성을 가질 가능성이 많기 때문이다.

  그러나 장르와 언어적 텍스트 유형이 반드시 일대일 대응하는 것은 아니다. 장르는 사회적으로 인식되는 범주이지만, 텍스트 유형은 순전히 언어적 특성으로 정의되므로, 어떤 장르에 속하는 특정 텍스트가 그 장르의 텍스트들이 일반적으로 갖는 언어 특성을 가지고 있지 않을 수 있고 따라서 한 장르의 텍스트들이 일반적으로 갖는 언어 특성을 가지고 있지 않을 수 있고 따라서 한 장르의 텍스트들이 상이한 텍스트 유형에 속할 수도 있을 것이다. 장르에 따라서는 그 장르에 속하는 텍스트들의 언어적 특성이 균질적이어서 거의 모두가 동일한 언어적 텍스트 유형에 속할 수도 있지만, 어떤 장르의 텍스트들은 그렇지 않다. 예를 들어, 스포츠 중계 방송 텍스트들은 모두 비슷한 언어 특성을 가지고 있지만, 학술 문헌 텍스트들은 그렇지 않다.

 장르, 문체 및 텍스트 유형의 연구는 질적인 연구와 양적인 연구의 두 방향에서 이루어져 왔다. 질적인 연구란 소량의 텍스트를 연구자가 정밀하게 분석하여 텍스트에 나타나는 언어적, 문체적 특성을 분석하는 것이다. 이러한 질적 연구는 그 나름대로의 의미가 있지만, 방법상의 제약으로 많은 양의 텍스트를 광범위하게 다룰 수는 없다. 많은 양의 텍스트를 기계적으로 처리하여 좀 더 넓은 시각에서 텍스트의 언어 특성을 연구하는 것이 양적 연구의 태도이다. 양적인 연구는 이전부터 있었지만, 컴퓨터의 발전이 양적 연구에 대한 전기를 마련해 주었다고 볼 수 있다. 컴퓨터에 텍스트를 입력하여 전자화한 경우, 반복되는 간단한 작업들이 자동적으로 신속히 수행됨으로써 이전에 할 수 없었던 많은 분석이 가능해진 것이다. 영어 텍스트의 장르와 문체 연구를 위해 바이버(Biber 1988)가 채택한 다변량/다차원 통계적 분석 방법은 이러한 맥락에서 가능해진 것이다.

 

제13장 언어와 컴퓨터, 전산언어학

 1. 전산언어학이란?

 

  전산언어학(computational linguistics)은 컴퓨터로 인간의 언어를 처리하기 위한 기초적, 응용적 연구이다. 언어의 처리는 컴퓨터가 언어를 이해하는 것과 컴퓨터가 언어를 산출하는 것을 말한다. 전산언어학은 언어학과 컴퓨터과학의 공통 영역으로, 언어학자와 컴퓨터과학자의 협력이 요구되는 분야이다. 컴퓨터의 언어처리에 언어학적 지식이 필요한 그 예가 있다.

 

EXAMPLE

The exercise gives every boy a big challenge.

 

--->컴퓨터가 이 문장을 올바로 이해하거나 산출하기 위해서는 적어도 몇 개의 지식이 필요하다. 각 단어의 의미에 대한 어휘의미 지식, 'the'가 이전의 담화 맥락에서 'exercise'가 이미 언급되었다는 것을 나타낸다는 화용 지식, 'give'가 아니라 'gives' 형식으로 일치가 일어난다는 문법 지식, 'big challenge'의 'big'은 'big ship'에서 'big'의 의미와 달리 추상적이며, 따라서 'big'의 의미는 수식하는 명사에 의존한다는 의미 지식이다.

 

  사람은 이와 같은 언어 지식을 무의식 속에 내재하고 있어 문장을 이해하고 산출하는 데 어려움이 없지만, 컴퓨터로 언어를 처리하기 위해서는 각각의 언어 지식을 명시적으로 컴퓨터 프로그램 속에 구현하여야 한다. 언어학자가 컴퓨터 프로그램의 구현까지 할 수도 있지만, 일차적으로 언어학자의 임무는 명시적으로 언어 지식을 기술하며 전산학자와 협력하는 일이다. 그렇다면 결국 언어 지식을 탐구하는 언어학자는 원론적으로는 모두 전산언어학에 기여하고 있다고 볼 수 있다. 다만, 컴퓨터의 언어 처리를 염두에 두고 언어를 연구함으로써, 좀 더 엄격한 규칙을 세운다든지 혹은 때에 따라서 이론적 일관성보다는 책략에 의한 언어 처리의 가능성을 모색한다는 점에 차이가 있다. 사람이라면 문장을 읽는 즉시 문법적으로 왜 그런 문장인 것인지, 이 말이 무슨 말인지를 이해할 수 있는 반면에 컴퓨터가 문장 하나를 제대로 이해하기 위해서는 정말 많은 언어 지식을 탑재하고 있어야 하고 그러한 여러 지식들을 통합적으로 재빠르게 적용하고 구현시켜야 한다는 것인데, 그러한 기술을 적용시키려면 정말 어렵겠다는 생각이 든다. 직접 알고 이해하는 것은 쉬울 수 있지만, 그걸 기계에 적용을 한다는 것이 쉽지 않을 것이다. 하나의 기술의 발전에는 전산학자는 물론이고 언어학자의 역할도 굉장히 크다는 것을 알게 되었다.