Traducción

El
conocimiento
de
sentido
comn,
Ontologa
y
Lenguaje
Ordinario
Resumen:
Hace ms de dos dcadas una "revolucin bastante" abrumadoramente enfoques
reemplazados conocimientos basados en el procesamiento del lenguaje natural (NLP) por
cuantitativa (EEG, aprendizaje automtico, estadsticos, basados corpus) mtodos.
Aunque es nuestra firme conviccin de que los enfoques puramente cuantitativos no
pueden ser el nico paradigma de la PNL, la insatisfaccin con puramente de ingeniera
se acerca a la construccin de grandes bases de conocimiento para la PNL son algo
justificado. En este trabajo esperamos demostrar que ambas tendencias son en parte
equivocada y que ha llegado el momento de enriquecer la semntica lgica con una
estructura ontolgica que refleja nuestra opinin de sentido comn del mundo y la forma
en que hablamos en el lenguaje ordinario. En este trabajo se demostr que el supuesto de
una estructura de este tipo ontolgico una serie de retos en la semntica del lenguaje
natural (por ejemplo, la metonimia, intensionalidad, copredication, compuestos nominales,
etc.) puede ser adecuada y uniformemente dirigida.
***
Hace ms de dos dcadas una "revolucin bastante", como Charniak (1995) una vez que
la llamaba, abrumadoramente reemplazado sabe enfoques ledgebased en el
procesamiento del lenguaje natural (NLP) por (por ejemplo, aprendizaje de mquina,
estadsticos, basados en corpus) mtodos cuantitativos. En los ltimos aos, sin embargo,
los trminos de la ontologa, la web semntica y la computacin semntica han estado en
boga, y con independencia de cmo se utilizan estos trminos (o mal utilizados) creemos
que esta "contra-revolucin semntica 'es una tendencia positiva desde corpus los
enfoques basados en la PNL, si bien son tiles en algunas tareas de procesamiento del
lenguaje - ver (Ng y Zelle, 1997) para una buena crtica - no puede dar cuenta de la
composicionalidad y la productividad en el lenguaje natural, por no hablar de los
complejos patrones de inferencia que se producen en comn el uso del lenguaje. Las
inferencias que tenemos en mente aqu se pueden ilustrar con el siguiente ejemplo:
(1) Pase ese coche le.
a. l es realmente molesto conmigo.
b. Son realmente me molesta
Claramente, los hablantes del lenguaje ordinario pueden inferir fcilmente que "l" en (1a)
se refiere a la persona que conduca [que] coche, mientras que "ellos" en (1b) es una
referencia a la gente que monta [que] coche. Tales inferencias, a nuestro juicio, no pueden
en teora ser aprendidas (cmo se necesitarn muchos ejemplos de este tipo?), Y son por
lo tanto ms all de las capacidades de cualquier enfoque cuantitativo. Por otro lado, y
aunque es nuestra firme conviccin de que los enfoques puramente cuantitativos no
pueden ser el nico paradigma de la PNL, la insatisfaccin con puramente de ingeniera
se acerca a la construccin de grandes bases de conocimiento para la PNL (por ejemplo,
Lenat y Ghua, 1990) son algo justificado . Mientras que la "comprensin" el lenguaje es en
su mayor parte un proceso de sentido comn 'razonamiento' a nivel pragmtico, como
ejemplo (1) ilustra, las estructuras de conocimiento que un sistema debe utilizar la PNL
deben tener fundamentos lingsticos y ontolgicos de sonido y deben ser formalizada si
que jams esperamos construir sistemas escalables (o como dijo una vez John McCarthy,
si que jams esperamos construir sistemas que podemos realmente bajo de pie!). Por lo
tanto, y como hemos argumentado en otra parte (Saba, 2007), creemos que ambas
tendencias son en parte equivocada y que ha llegado el momento de enriquecer la
semntica lgica con una estructura ontolgica que refleja nuestra visin comn del
mundo
y
la
forma
en
que
hablamos
en
el
lenguaje
ordinario.
Especficamente, argumentamos que muy pocos avances en la semntica lgica se han
hecho en los ltimos aos debido al hecho de que estos sistemas son, en su mayor parte,
meros sistemas de manipulacin de smbolos que estn desprovistos de cualquier
contenido. En particular, en este tipo de sistemas en los que apenas hay un enlace ny
entre semntica y nuestra visin comn del mundo, es muy difcil imaginar cmo se puede
"descubrir" la considerable cantidad de contenido que es claramente implcita, pero casi
nunca se indica explcitamente en nuestro discurso cotidiano. Por ejemplo, considere lo
siguiente:
(2) a. Simon es una roca.
b. El bocadillo de jamn quiere una cerveza.
c. Saba es elocuente.
d. Jon compr una casa de ladrillo.
e. Carlos le gusta jugar al bridge.
f. Jon disfrut el libro.
g. Jon visit una casa en cada calle.
A pesar de que tienden a utilizar el menor nmero de palabras para transmitir un
pensamiento particular (tal vez por computacional efectividad, como Givon (1984) sugiri
una vez), altavoces del lenguaje ordinario entender claramente las oraciones en (2) como
sigue:
(3) a. Simon es [tan slido como] una roca.
b. La [persona come el] bocadillo de jamn quiere una cerveza.
c. Saba es [un] articulado [persona].
d. Jon compr un [-integrada] casa de ladrillo.
e. Carlos le gusta jugar [el juego] puente.
f. Jon disfrut [lectura / escritura] el libro.
g. Jon visit una casa [diferente] en cada calle.
Claramente, cualquier semntica composicional deben dar cuenta de alguna manera por
esta [falta texto], ya que tales frases son bastante comn y no son en absoluto extico,
inverosmil, o artificial. Los lingistas y los semnticos generalmente se han ocupado de
tales sentencias mediante la investigacin de diversos fenmenos como metfora
(3a) metonimia
(3b) vinculacin textual
(3c) compuestos nominales
(3d) la ambigedad lxica
(3e) co-predicacin
(3f) y cuantificador alcance ambigedad
(3g) para nombrar unos pocos.
Sin embargo, y aunque parece que tienen un denominador comn, es algo sorprendente
que en el estudio de la literatureone encuentra que estos fenmenos se han estudiado de
manera independiente; hasta el punto de que hay muy poco, si alguno, que parece ser
comn entre los diversos ls proposa que a menudo se sugieren. En nuestra opinin, este
estado de cosas es muy problemtico, ya que la perspectiva de un paradigma distinto
para cada fenmeno nico en el lenguaje natural no puede ser realista contemplado. Por
otra
parte,
y
como
esperamos
demostrar en este trabajo, creemos que no es de hecho un sntoma comn que subyace a
estos (y otros) problemas difciles en la semntica del lenguaje natural. Antes de hacer
nuestro caso, vamos en esta coyuntura muy temprano sugieren esta explicacin informal
de la seorita ing texto en (2): slido es (una de) las caractersticas ms sobresalientes de
una roca (2a); la gente, y no un sndwich, tienen 'quiere' y comer es la relacin ms
saliente que sujeta entre un humano y un Sandwich
(2b) 1; Humano es el tipo de objeto de que articulan es la caracterstica ms sobresaliente
(2c); hecho de la relacin es ms sobresaliente entre un artefacto (y por consiguiente una
casa) y una sustancia (ladrillo)
(2d); El juego es la relacin ms saliente que sujeta entre un humano y un juego, y no
algn tipo de estructura (y, el puente es un juego); y, por ltimo, en el (posible) mundo en
el que vivimos, una casa no puede ser localizado en ms de una Street. El punto de esta
explicacin informal es sugerir que el problema que subyace en la mayora de los
desafos en la semntica del lenguaje natural parece estar en formalismos semnticos
que emplean lgicas que son meros sistemas de manipulacin de smbolos abstractos;
sistemas que carezcan de contenido ontolgico. Lo que proponemos, en cambio, es una
semntica de composicin que se basa en la metafsica de sentido comn, una semntica
que ve "lgica como un lenguaje"; es decir, una lgica que tiene contenido, y el contenido
ontolgico, en particular, como se ha defendido recientemente y bastante
convincentemente por Cocchiarella (2001). En el resto del artculo vamos a proponer en
primer lugar una semntica que se basa en una ontologa inflexible de tipos que refleja
nuestro punto de vista del sentido comn de la realidad y la forma en que hablamos sobre
esto en el lenguaje ordinario; posteriormente, vamos a formalizar la nocin de "propiedad
sobresaliente" y "relacin sobresaliente" y sugerir cmo un sistema de composicin
fuertemente tipado, posiblemente puede utilizar esa informacin para explicar algunos
fenmenos complejos en lenguaje natural.
UN SISTEMA TIPO DE LENGUAJE ORDINARIO
La utilidad de enriquecer la ontologa de la lgica mediante la introduccin de variables y
cuantificacin es bien conocida. Por ejemplo, (q p) r no es ni siquiera una declaracin
vlida en proposicional lgica, cuando p = todos los humanos son mortales, q _ = _
Socrates_is_a_human y r _ = _ Socrates_is_mortal. En la lgica de primer orden, sin
embargo, esta inferencia se produce fcilmente, mediante la explotacin de un aspecto
importante
de
variables,
a
saber,
su
mbito
de
aplicacin.
Sin embargo, y como en breve se demostr, copredication, metonimia y varios otros
problemas que son relegados a intensionalidad en lenguaje natural se deben al hecho de
que otro aspecto importante de una variable, es decir, su tipo, no ha sido explotado. En
particular, al igual que el alcance conecta varios predicados dentro de una frmula,
cuando una variable tiene ms de un tipo en un solo mbito, el tipo de unificacin es el
proceso mediante el cual uno puede descubrir relaciones implcitas que no se indican de
forma explcita, pero son de hecho implcito en la jerarqua de tipos. Para empezar, por lo
tanto, vamos a introducir primero un sistema de tipo que se asume en el resto del papel.
El rbol de la Lengua
En Tipos y Ontologa Fred Sommers (1963) sugiri hace varios aos que existe un
establecimiento inflexible en tologa que parece estar implcito en todo lo que se dice en el
lenguaje hablado ordinario, en el que dos objetos x e y se consideran del mismo tipo si y
slo si el conjunto de mondicos predicados que son significativamente (es decir,
verdadera o falsa, pero no absurdo) predicable de x es equivalente al conjunto de

predicados que son significativamente predicable de y. Por lo tanto, mientras ellos hacen
una referencia a cuatro clases distintas (conjuntos de objetos), para una ontlogo
interesado en la relacin entre la ontologa y el lenguaje natural, los sintagmas nominales
en (4) estn refiriendo en ltima instancia, a slo dos tipos, a saber, gato y nmero:
(4) a. un gato viejo
b. un gato negro
c. un nmero par
d. un nmero primo
En otras palabras, si hacemos una referencia a un viejo gato o gato ablack, en ambos
casos estamos hablando en ltima instancia, de los objetos que son del mismo tipo; y
esto, de acuerdo con Sommers, es un reflejo del hecho de que el conjunto de predicados
mondicos en nuestro lenguaje natural que son significativamente predicable de gatos
viejos es exactamente el mismo conjunto que es significativamente predicable de gatos
negros. Digamos sp (t, s) es verdadero si s es el conjunto de predicados que son
significativamente predicable de algn tipo t, y sea T representar el conjunto de todos los
tipos en nuestra ontologa, a continuacin,
Es decir, que es un tipo (en la ontologa) es tener un conjunto no vaco de predicados que
son significativamente predicable
(5a) 2; y un tipo de s es un subtipo de t si y slo si el conjunto de redicates que son
significativamente predicable de s es un subconjunto del conjunto de predicados que son
significativamente predicable de t
(5b); en consecuencia, la identidad de un concepto (y por lo tanto Concep similitud t) est
bien definida dada por (5c). Nota aqu que, segn
(5a), objetos abstractos, tales como eventos, estados, propiedades, actividades,
procesos, etc., son tambin parte de nuestra ontologa ya que el conjunto de predicados
que es significativamente predicable de cualquier objeto no est vaca. Por ejemplo,
siempre se puede hablar de un evento inminente, o un evento que fue cancelado, etc., es
decir sp (Incluso, {INMINENTE, CANCELADO, etc.}). Adems de los eventos, objetos
abstractos, tales como los estados y procesos, etc., tambin puede predicarse; por
ejemplo, en el correo siempre se puede decir de ralent de un cierto estado, y uno siempre
hablar de inicio y terminacin de un proceso, etc. En nuestra representacin, por lo tanto,
pertenecen a dos conceptos categoras muy distintas: (i) los conceptos ontolgicos, como
Animal, de sustancias, Entidad, Artefacto, Evento, Estado, etc., que se supone que existe
una jerarqua en la subsuncin, y donde el hecho de que un objeto de tipo humano es (en
ltima instancia) un objeto del tipo de entidad se expresa como? Entidad Humano; y (ii)
los conceptos lgicos, que son las propiedades (que se puede decir) y de las relaciones
(que puede contener) entre conceptos ontolgicos. Para ilustrar la diferencia (y la
relacin) entre los dos, considere lo siguiente:
Los predicados en (6) se supone que deben reflejar el hecho de que en el lenguaje
hablado ordinario que podemos decir VIEJO de cualquier Entidad; que decimos PESADO
de objetos que son de tipo fsico; HAMBRE que se dice de los objetos que son de tipo
habitable; que articulan Se dice de los objetos que deben ser de typeHuman; que marca
es una relacin que puede contener entre un humano y un artefacto; que la fabricacin es
una relacin que puede contener entre un humano y un instrumento, etc. Tenga en cuenta
que las asignaciones de tipo en (6) definen implcitamente una jerarqua de tipos como el
que se muestra en la figura 1 a continuacin. En consecuencia, y aunque no se menciona
explcitamente en (6), en el lenguaje hablado ordinario uno puede siempre atribuir la
PESADO propiedad a un objeto de tipo de coches desde
Figura 1 La jerarqua de tipos implcitos en (6)

Adems de conceptos lgicos y ontolgicos, tambin hay nombres propios, que son los
nombres de los objetos; objetos que podran ser de cualquier tipo. Un nombre propio,
como seba, se interpreta como
donde NOO (x :: cosa, s) es cierto de algn objeto individual x (que podra ser cualquier
cosa), y si s (la etiqueta) s es el nombre de x, y t es probablemente el tipo de objetos que
se aplica P a (para simplificar la notacin, sin embargo, vamos a menudo escribir (7)
como
Considere ahora lo siguiente, donde PROFESOR (x :: Ser humano), es decir, el que se supone
PROFESOR ser una propiedad que se dice ordinariamente de los objetos que deben ser de tipo
humano, y donde BE (x, y) es verdadera cuando x y y son los mismos objetos:
Esto indica que no es un objeto nico llamado seba (que es un objeto que podra ser cualquier
cosa), y algunos x tal que x es un maestro (y por lo tanto debe ser un objeto de tipo humano), y
de tal manera que seba es que x . Desde BE (seba, x), podemos sustituir y por el constante seba
obtener lo siguiente:
Note now that sheba is associated with more than one type in a single scope. In these situations
a type unification must occur, where a type unification (s*t) between two types s and t and where
Q {, }, is defined (for now) as follows
where R is some salient relation that might exist between objects of type s and objects of type t.
That is, in situations where there is no subsumption relation between s and t the type unification
results in keeping the variables of both types and in introducing some salient relation between
them (we shall discuss these situations below). Going to back to (9), the type unification in this
case is actually quite simple, since
En el anlisis final, por lo tanto, seba es un maestro se interpreta de la siguiente manera: hay un
objeto nico llamado seba, un objeto que debe ser de tipo humano, de tal manera que seba es un
maestro. Nota aqu la clara distincin entre los conceptos ontolgicos (como humano), que
Cocchiarella (2001) llama conceptos primero-intensin, y (intensin o segundo) lgico conceptos,
tales como MAESTRO (x). Es decir, lo ontolgicamente existir son objetos de tipo humano, no
docentes, y maestro es una mera propiedad de que hemos llegado a utilizar para hablar de los
objetos de tipo Human4. En otras palabras, mientras que la propiedad de ser un maestro que pueden
exhibir x es accidental (as como temporal, cultural-dependiente, etc.), el hecho de que algunos x es
un objeto de tipo humano (y por tanto un animal, etc. ) no lo es. Por otra parte, un concepto lgico
como MAESTRO se supone que se define en virtud de alguna expresin lgica como ( x ::
Humano) (MAESTRO (x) df), donde la naturaleza exacta de podra muy bien ser susceptible a
factores contextuales temporales, culturales, y otros, en funcin de lo que, en un cierto punto en el
tiempo, una cierta comunidad considera que un maestro sea. En concreto, el concepto MAESTRO
lgica debe ser definida por alguna expresin como
Es decir, cualquier x, que debe ser un objeto de tipo humano, es un si y slo si x MAESTRO es el
agente de alguna actividad a, donde a es una actividad docente. Ciertamente, no es por
comodidad, la elegancia o la mera indulgencia ontolgica que un concepto lgico, como maestro
debe ser definido en trminos de las categoras ms bsicas ontolgicas (como una actividad)
como se puede ilustrar con el siguiente ejemplo:
Tenga en cuenta que en (12), es seba, y no la enseanza que se considera errneamente que ser
magnfico. Esto es problemtico por dos razones: en primer lugar, mientras que MAGNFICO es
una propiedad que podra aplicarse a objetos de tipo humano (como seba), la forma lgica en
(12) debe tener una referencia a un objeto del tipo de actividad, ya que es un magnfico
propiedad que tambin se podra decir de la actividad docente de seba. Este punto se hizo ms
aguda cuando magnfico se sustituye por adjetivos tales como psimo certificados, etc., donde
las propiedades correspondientes ni siquiera se aplican a seba, pero estn modificando
claramente la actividad docente de seba (que est certificado, o psimo, etc.) Vamos a hablar de
este tema con cierto detalle a continuacin. Antes de continuar, sin embargo, tenemos que
ampliar la nocin de tipo de unificacin ligeramente.
2.2 Ms sobre Tipo de Unificacin
Debe quedar claro por ahora que nuestra ontologa, tal como se define hasta el momento, asume
un universo platnico que admite la existencia de cualquier cosa que se puede hablar en la
nguage ordinaria. De este modo, y como tambin argumentado por Cocchiarella (1996), ser
lados abstracto objetos, referencia en el lenguaje ordinario se pueden hacer a los objetos que
pudieran tener o podra haber existido, as como a los objetos que pudieran existir en el futuro.
En general, por lo tanto, una referencia a un objeto puede ser

Traducción

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Traducción

Uploaded by

Copyright:

Available Formats

El

verdadera o falsa, pero no absurdo) predicable de x es equivalente al conjunto de

Figura 1 La jerarqua de tipos implcitos en (6)

You might also like