Professional Documents
Culture Documents
2 arquitectura conceptual de la AI
los posibles diseos de la OAI son innumerables y es imposible
predecir en detalle cmo se implementarn. A los fines de este
prximas elecciones con una lista detallada de los tomos que ser
en qu posicin como resultado de esa eleccin no responde a la
pregunta. La OAI debe estar motivado para proporcionar respuestas
comprensibles por humanos. Sin embargo, esto requerir tanto a
comprender y aplicar los conceptos humanos. De ah la precisin, en
general, es un
5-AI problema completo (aunque ms estrecho AIs tratar problemas wer
narro no
requieren plena AI - exhaustividad para funcionar eficazmente) .
Aunque la precisin es mucho ms fcil
tha n amabilidad Yudkowsky (2001b) , requiere que la OAI ser capaces
de
comprender los conceptos humanos duro t hat slo estn definidas
dentro de nuestro cerebro.
5 Un trmino acuado por Mallery Fanya Montalvo (1988) por analoga
con el concepto matemtico de NP-completitud: Un problema es AIcompleto si una IA capaz de solucionar razonablemente podra tambin
ser capaz de resolver los principales problemas pendientes de AI.
5
4 Mtodos de control
en esta seccin, analizaremos los distintos mtodos que pueden ser
usados para el control de la OAI. El objetivo es asegurar la OAI no
tiene objetivos que van ms all de responder a nuestras preguntas
con precisin, o para impedir la aplicacin de tales objetivos.
Los diferentes mtodos pueden agruparse en tres categoras
generales. La primera categora, la capacidad de control, se ocupa
de aquellos mtodos que intentan contener la OAI a travs asegurar
fsicamente o controlar la informacin a la que tiene acceso o
salida. La segunda categora, el control motivacional, introduce los
mtodos que controlan la OAI a travs de su motivacin, asegurando
que no tiene propensin a causar ningn dao a los seres humanos. Y
por ltimo, hay algunos mtodos diseados para prevenir la OAI no
causen daos pero para verlo cuando lo hace; estos se encuentran en
la categora de controles y equilibrios.
4.1 Capacidad de
control de la capacidad de control es el ms bsico y el ms obvio
de manera de controlar la OAI. Para el control de un ser humano,
ponemos a l o a ella en la crcel o el confinamiento en solitario,
negando las interacciones con el mundo exterior.
4.1.1 Capacidad Fsica
Definir el reloj
Otro componente fundamental de la ontologa de la OAI es el tiempo.
Una OAI que libremente se pueden redefinir su propia cronologa es
un riesgo de seguridad. El riesgo se torna ms aguda cuando nos
damos cuenta de cunto de significados y definiciones humanas giran
en torno a un concepto de tiempo y, en consecuencia, que la
redefinicin de duracin puede redefinir el significado. Hay una
cierta jerarqua de los conceptos aqu - la ms perfecta definicin
de la justicia o el placer es intil si la OAI no puede distinguir
un humano a partir de una roca. Y la definicin de derechos es
igualmente intil si la OAI obtiene tiempo y espacio equivocado. Por
lo tanto errores en estos conceptos de tierra arriba en cascada,
aumentando la probabilidad de error.
Tericamente, la OAI del propio cdigo, si se verifica, podra
utilizarse para obtener sincronizacin por conteo de ciclos de reloj
- pero esto falla si la OAI es capaz de ralentizar o acelerar su
propio funcionando. Un reloj basado en eventos astronmicos
distantes necesita un telescopio para ser ledo; un reloj fsico
real est dentro de la OAI el poder de influencia. Estos hechos
ponen de manifiesto que los desafos son de tres tipos: definir el
reloj, asegurando la OAI mirar, y garantizando la OAI no manipule
(que incluye la manipulacin con cualquier procedimiento que hemos
aplicado para que se mire). El procedimiento puede fallar en los
tres puntos, pero parece tericamente ms accesibles que las
restricciones espaciales de la seccin anterior.
Timed respuestas
dadas el reloj descrito anteriormente (o la "caja negra" de la
versin de la misma, consulte la seccin 4.2.2), es una precaucin
sencilla que es fcil de agregar a la OAI: dar la OAI un tiempo
especificado para responder una pregunta (o devolver
"indeterminado"), y se apague automticamente despus de que el
perodo de tiempo especificado. Esto minimiza la cantidad de tiempo
durante el cual la OAI podra causar daos. Incluso con un reloj de
seguridad, ste no es un mtodo seguro, como tenemos una comprensin
muy limitada de cmo rpidamente una OAI podra causar daos si se
convirti su gran inteligencia en ese sentido. Un lapso muy corto de
tiempo, probablemente sera seguro, pero tambin podra ser
demasiado corto para la OAI para responder a la pregunta.
4.2.2 Control motivacional de caja negra
calcula la indiferencia
si tenemos acceso a la funcin de utilidad de la OAI, y si esa
funcin de utilidad es algo comprensible para nosotros, podramos
hacer la OAI indiferente ante un evento especfico (Armstrong 2010).
El evento elegido en ese documento era un componente de la
detonacin de explosivos, haciendo as que la OAI indiferente a si
los explosivos detonaron en esa forma podra realmente explotar. De
ah que la OAI no tendra que tomar todas las precauciones para
protegerse a s misma de esta detonacin, dndonos una oportunidad
adicional para evitar su mal comportamiento. Consulte el documento
original para obtener ms detalles sobre este tema.
Para una OAI, un destino ms interesante de calculada indiferencia
es hacia el contenido de sus respuestas: una OAI indiferente si sus
respuestas fueron leer o no no estaran motivados para usar la
ingeniera social en su salida. Hay muchos otros puntos donde se
calcula la indiferencia podra utilizarse para lograr resultados
concretos.
La atraccin de la indiferencia es que, una vez aplicado, se
mantiene estable (la OAI est motivado para preservar sus
motivaciones actuales), y que se pueden implementar sin comprender
la OAI toda la funcin de utilidad. Todo lo que se necesita es la
habilidad para describir el evento en particular estamos interesados
(en (Armstrong, 2010), un nico evento cuntico) y utilizar la OAI
la propia capacidad para construir counterfactuals alrededor de
este. Estos pueden ser usados incluso si la funcin de utilidad de
la OAI es otra cosa muy oscuro.
4.3 controles y equilibrios de
la ltima sub-categora de mtodos de control implica que no se
restrinja la capacidad fsica de la OAI, directamente ni interferir
con su motivacin, sino ms bien intentar coger las primeras etapas
de una OAI comportarse peligrosamente (y luego, presumiblemente,
darlo por terminado). Esto tambin funciona en la OAI la motivacin,
como el riesgo de ser atrapado empujara la OAI a lo largo de ms
humano-friendly trazados. Siempre debe suponerse que un til OAI es
considerablemente ms inteligentes que sus programadores, as que
cualquier ingenuo 'trucos' probablemente no funcionan. Neve
rtheless, los siguientes mtodos son de inters.
Las preguntas del test de
un pequeo pero til precaucin es calcular de forma independiente
las respuestas a determinadas preguntas, y comprobarlos contra
algunas de las respuestas del OAI. El alcance de este mtodo est
limitado por nuestra capacidad para responder a preguntas difciles,
y por el hecho de la OAI puede darse cuenta de que estamos haciendo
esto, y por lo tanto ajustar su comportamiento slo para aquellas
preguntas especficas.
desviarse
contestar
Todos los
la verdad
Por otro lado, el problema con la OAI simulando las mentes humanas
son principalmente ticos: son estos seres humanos simulada
consciente y viva? Y, si lo son, no estn siendo asesinados cuando
la simulacin se termin? Estn ustedes mismos no se simula mediante
una OAI tratando de resolver una pregunta especfica sobre la
psicologa humana (Bostrom 2003a)? Si es as, cmo se sentira si
la simulacin se termin? En vista de su velocidad y el tipo de
preguntas que se pedira, al nmero de personas que la OAI pueden
tener motivos para simular podra ejecutarse en el orden de los
billones de dlares. As, la inmensa mayora de los seres humanos
podra acabar siendo condenado simulaciones. Esta es una forma
extrema de la "mente" del delito (Bostrom 2012) donde la OAI causa
gran destruccin slo por el pensamiento.
Lo ideal sera que existiera un nivel de detalle especfico ms all
de los cuales la simulacin sera consciente, y antes de que no lo