Gramática categorial combinatória

Gramática categorial combinatória (CCG) é um formalismo gramatical eficiente analisável, ainda linguisticamente expressivo. Ele tem uma interface transparente entre a sintaxe de superfície e representação semântica subjacente, incluindo a estrutura predicado-argumento, quantificação e estrutura de informação. O formalismo gera estruturas à base de constituintes (em oposição aos baseados em dependência) e é, portanto, um tipo de expressão gramatical estruturada (em oposição a um dependência gramatical).

CCG depende de lógica combinatória, que tem o mesmo poder expressivo como o cálculo lambda, mas constrói suas expressões de forma diferente. Os primeiros argumentos lingüísticos e psicolingüísticos para basear a gramática em elementos combinatórios foram apresentadas por Steedman e Szabolcsi. Mais recentes defensores proeminentes da abordagem são Jacobson e Baldridge.

Por exemplo, o Combinador B (o compositor) é útil na criação de dependências de longa distância, como em "Com quem você acha que Maria está falando?" e o combinador W (o duplicador) é útil com a interpretação lexical de pronomes reflexivos, como em "Maria fala sobre si mesma". Juntamente com I (o mapeamento de identidade) e C (o permutador) formam um conjunto de primitivas, elementos da combinação não comparáveis. Jacobson interpreta pronomes pessoais como o combinador I, e sua ligação é auxiliado por um complexo combinador Z, como em "Maria perdeu seu caminho". Z é definido utilizando W e B.

Partes do formalismo

O formalismo CCG define uma série de combinadores (aplicação, composição, e sendo o mais comum os tipos de captação). Estes operam em itens lexicais sintaticamente-digitadas, por meio de provas utilizando dedução natural. O objetivo da prova é encontrar uma forma de aplicar os combinadores a uma seqüência de itens lexicais até que nenhum item seja utilizado na prova. O tipo resultante após a prova está completa é o tipo de toda a expressão. Assim, verificamos que uma sequência de palavras é uma sentença de uma linguagem para provar que as palavras reduzem tipo S.

Tipos sintáticos

O tipo sintático de um item lexical pode ser qualquer um do tipo primitivo, tal como S, N, ou NP, ou do tipo complexo, como S\NP, ou NP/N.

Os tipos complexos, esquematizados como X / Y e X \ Y , denotam tipos functor que levam um argumento do tipo Y e retornar um objeto do tipo X . A barra normal indica que o argumento deve aparecer para a direita, enquanto uma barra invertida indica que o argumento deve aparecer no lado esquerdo. Qualquer tipo pode substituir o X e Y , fazendo os tipos sintáticos em CCG um sistema do tipo recursivo.

Combinadores de aplicação

Os combinadores de aplicações, muitas vezes indicado por > para aplicações a frente e < para aplicação a trás, aplicam um item lexical com um tipo de functor para uma discussão com um tipo apropriado. A definição da aplicação é dada como:

α : X / Y β : Y α β : X > {\displaystyle {\dfrac {\alpha :X/Y\qquad \beta :Y}{\alpha \beta :X}}>}

β : Y α : X Y β α : X < {\displaystyle {\dfrac {\beta :Y\qquad \alpha :X\backslash Y}{\beta \alpha :X}}<}

Combinadores de composição

Os combinadores de composição, muitas vezes denotado por B > {\displaystyle B_{>}} para uma composição a frente e B < {\displaystyle B_{<}} para uma composição a trás, são semelhantes à composição de função em matemática, e pode ser definido da seguinte forma:

α : X / Y β : Y / Z α β : X / Z B > {\displaystyle {\dfrac {\alpha :X/Y\qquad \beta :Y/Z}{\alpha \beta :X/Z}}B_{>}}

β : Y Z α : X Y β α : X Z B < {\displaystyle {\dfrac {\beta :Y\backslash Z\qquad \alpha :X\backslash Y}{\beta \alpha :X\backslash Z}}B_{<}}

Combinadores de captação

Os combinadores de captação, frequentemente denotado como T > {\displaystyle T_{>}} para captações a frente e T < {\displaystyle T_{<}} para captações, tomar tipos de argumento (geralmente tipos primitivos) para Functor tipos, que tomam como argumento os functors que, antes da captação, teriam tomá-los como argumentos.

α : X α : T / ( T X ) T > {\displaystyle {\dfrac {\alpha :X}{\alpha :T/(T\backslash X)}}T_{>}}

α : X α : T ( T / X ) T < {\displaystyle {\dfrac {\alpha :X}{\alpha :T\backslash (T/X)}}T_{<}}

Exemplo

A frase "o cachorro atacou John" tem várias demonstrações possíveis. Abaixo estão alguns deles. A variedade de demonstrações mostra o fato de que em CCG, frases não tem uma estrutura única, como nos outros modelos de gramática.

Deixe os tipos desses itens lexicais ser

o : N P / N c a c h o r r o : N a t a c o u : ( S N P ) / N P J o h n : N P {\displaystyle o:NP/N\qquad cachorro:N\qquad atacou:(S\backslash NP)/NP\qquad John:NP}

We can perform the simplest proof (changing notation slightly for brevity) as:

o N P / N c a c h o r r o N N P > a t a c o u ( S N P ) / N P J o h n N P S N P > S < {\displaystyle {\dfrac {{\dfrac {{\dfrac {o}{NP/N}}\qquad {\dfrac {cachorro}{N}}}{NP}}>\qquad {\dfrac {{\dfrac {atacou}{(S\backslash NP)/NP}}\qquad {\dfrac {John}{NP}}}{S\backslash NP}}>}{S}}<}

Optando pelo tipo de captação e composição, poderíamos obter uma prova totalmente incremental, da esquerda para a direita. A capacidade de construir uma prova é um argumento para a plausibilidade psicolingüística da CCG, porque os ouvintes que, de fato, construir interpretações parciais (sintáticos e semânticos) de enunciados antes de terem sido concluídos.

o N P / N c a c h o r r o N N P > S / ( S N P ) T > a t a c o u ( S N P ) / N P S / N P B > J o h n N P S > {\displaystyle {\dfrac {{\dfrac {{\dfrac {{\dfrac {{\dfrac {o}{NP/N}}{\dfrac {cachorro}{N}}\qquad }{NP}}>}{S/(S\backslash NP)}}T_{>}\qquad {\dfrac {atacou}{(S\backslash NP)/NP}}}{S/NP}}B_{>}\qquad {\dfrac {John}{NP}}}{S}}>}

Propriedades Formais

CCGs são conhecidos por serem capazes de gerar linguagens a n b n c n d n : n 0 {\displaystyle {a^{n}b^{n}c^{n}d^{n}:n\geq 0}} (que é uma linguagem indexada). Exemplos disto são, infelizmente, complicados para fornecer aqui, mas podem ser encontrados em Vijay-Shanker e Weir (1994).[1]

Equivalências

Vijay-Shanker and Weir (1994)[1] demonstra que Gramática Indexada, Gramática categorial combinatória, Gramática árvore-adjacente e Gramática de Cabeça são formalismos fracamente equivalente , em que tudo o que eles definem as mesmas cadeias da linguagem.

Ver também

Referências

  1. a b Vijay-Shanker, K. and Weir, David J. 1994. A equivalência das quatro extensões das gramáticas livres de contexto. Mathematical Systems Theory 27(6): 511–546.
  • Baldridge, Jason (2002), "Lexically Specified Derivational Control in Combinatory Categorial Grammar." PhD Dissertation. Univ. of Edinburgh.
  • Curry, Haskell B. and Richard Feys (1958), Combinatory Logic, Vol. 1. North-Holland.
  • Jacobson, Pauline (1999), “Towards a variable-free semantics.” Linguistics and Philosophy 22, 1999. 117–184
  • Steedman, Mark (1987), “Combinatory grammars and parasitic gaps”. Natural Language and Linguistic Theory 5, 403–439.
  • Steedman, Mark (1996), Surface Structure and Interpretation. The MIT Press.
  • Steedman, Mark (2000), The Syntactic Process. The MIT Press.
  • Szabolcsi, Anna (1989), "Bound variables in syntax (are there any?)." Semantics and Contextual Expression, ed. by Bartsch, van Benthem, and van Emde Boas. Foris, 294–318.
  • Szabolcsi, Anna (1992), "Combinatory grammar and projection from the lexicon." Lexical Matters. CSLI Lecture Notes 24, ed. by Sag and Szabolcsi. Stanford, CSLI Publications. 241–269.
  • Szabolcsi, Anna (2003), “Binding on the fly: Cross-sentential anaphora in variable-free semantics”. Resource Sensitivity in Binding and Anaphora, ed. by Kruijff and Oehrle. Kluwer, 215–229.

Outras leituras

  • Michael Moortgat, Categorial Type Logics, Chapter Two in J. van Benthem and A. ter Meulen (eds.) Handbook of Logic and Language. Elsevier, 1997, ISBN 0-262-22053-9
  • http://homepages.inf.ed.ac.uk/steedman/papers/ccg/SteedmanBaldridgeNTSyntax.pdf

Ligações externas

  • The Combinatory Categorial Grammar Site
  • The ACL CCG wiki page (likely to be more up-to-date than this one)