| Resumen: | Un método y un sistema para recuperar expedientes de la base de datos, basados en un fósforo cercano a un expediente especificado de la pregunta, usando una medida de la distancia de determinar la proximidad del fósforo. El método emplea un proceso de dos etapas para reducir el número de las comparaciones directas requeridas. En una primera etapa, un trie del triángulo para una sola medida de la distancia se poda para reducir un número de fósforos del potencial. El resultado obtenido de podar el trie del triángulo es podado más a fondo empleando las tablas puestas en un índice generadas usando una técnica de la desigualdad del triángulo. Entonces comparan a los miembros de este sistema pequeño directamente al expediente de la pregunta para identificar fósforos dentro por lo menos de un grado especificado de proximidad. Los intentos múltiples del triángulo se pueden combinar para permitir búsquedas del umbral sobre una medida compuesta. Las operaciones, incluyendo el minuto, el máximo, la suma, y el peso se combinan para producir funciones de distancia compuestas más complejas para el uso en el proceso. |
|
| Demanda (s): | La invención en la cual se demanda una derecha exclusiva es definida por siguiente: 1. Un método para identificar cualquier dato se opone en un sistema de datos se opone eso empareja un objeto de los datos de la pregunta dentro de un límite definido, método dicho abarcar los pasos de: (a) determinación: (i) un sistema de los objetos dominantes en sistema de objetos de los datos; (ii) un sistema de los vectores emparentados, tales que para cada uno los datos se oponen en el sistema de objetos de los datos, un vector emparentado describen en menos un tipo de medida de la distancia entre eso los datos se opone y cada llave objeto en el sistema de los objetos dominantes; y (iii) un trie del triángulo para cada uno diverso tipo de medida se define que, cada trie de la distancia del triángulo teniendo un número de niveles que son menos que un número de llave se opone adentro sistema dicho de los objetos dominantes; (b) permitir a un usuario seleccionar un objeto de la pregunta y para seleccionar por lo menos un tipo de distancia mida a el cual sea utilizado empareje un objeto de los datos del sistema de objetos de los datos al objeto dicho de la pregunta; (c) determinación de un vector emparentado de la pregunta para el objeto dicho de la pregunta, tal ese vector emparentado de la pregunta dicha describe una medida de la distancia en medio el objeto dicho de la pregunta y cada objeto dominante para cada tipo de distancia miden seleccionado; (d) para cada triángulo trie se relacionó con una medida de la distancia seleccionado por un usuario, podando ese trie del triángulo para producir a potencialmente el sistema que empareja de datos se opone de cuál cualquieres objetos de los datos que no puedan el objeto dicho fósforo de la pregunta dentro del límite definido se ha eliminado, de tal modo reducción de un número de objetos de los datos en el sistema potencialmente que empareja eso potencialmente requerirá comparaciones directas con el objeto dicho de la pregunta; y (e) directamente comparando objetos de los datos del sistema dicho de objetos de los datos eso todavía no se ha eliminado para identificar ningún objeto de los datos eso empareja el objeto de los datos de la pregunta dentro del límite definido. 2. El método de la demanda 1, en donde el paso de la determinación abarca pasos de identificar: (a) más de tres objetos dominantes; y (b) por lo menos tres niveles en cada trie del triángulo. |
|
|
|
|
| Descripción: | USO RELACIONADO[0001] Este uso se basa en un provisional co-pending anterior uso, Ser. No. 60/181.607, archivado el febrero. 10, 2000, la ventaja de la fecha de limadura de la cual se demanda por este medio debajo de 35 U.S.C. .sctn.119 (e).CAMPO DE LA INVENCIÓN[0003] La actual invención se relaciona generalmente con buscar una base de datos para datos específicos, y más específicamente, a un método y a un sistema para recuperando los expedientes de la base de datos que son fósforos cercanos a una pregunta especificada expediente, de una manera de cómputo eficiente.FONDO DE LA INVENCIÓN[0004] Hay a menudo una necesidad de recuperar los expedientes de la base de datos que son fósforos cercanos a un expediente especificado de la pregunta. Búsquedas del comodín adentro las bases de datos basadas texto son un ejemplo bien conocido de tal búsqueda para los datos emparejar por lo menos una porción especificada de un expediente. Si es el investigador inseguro de cómo deletrear una palabra, o no desea mecanografiar adentro una palabra entera, a el carácter del comodín tal como un asterisco se puede utilizar en la pregunta a indique unos o más caracteres de la clase. Así, el buscar del investigador documentos textuales que se refieren a Albuquerque, New México, de el cual es inseguro cómo deletrear Albuquerque, o quién no desea afinar en la palabra entera puede incorporar una pregunta usando solamente “Alb*.” Aunque los resultados de tal a la búsqueda pudo incluir otros datos que también comienzan con la “alba” (por ejemplo, Alberta, Albany y Albania), las referencias a Albuquerque serán incluidas a la búsqueda da lugar, si tales referencias están dentro de los datos que son buscado.[0005] Observe que cualquier artículo textual escrito en una lengua, por su muy la naturaleza, se asocia típicamente a un bien definido y se limita vocabulario. El vocabulario que abarca una lengua permite fácilmente |
|
|
|
| EE.UU. Aplicación:
| 20020002550 |