<p>Desde el punto de vista de una búsqueda en tiempo real sobre microblogs -twitter- nuevos datos deben quedar disponibles para su búsqueda inmediatamente después de su creación. En bases de datos tradicionales el requerimiento antes mencionado puede ser fácilmente satisfecho creando un índice, el cual es evaluado midiendo el intervalo de tiempo que transcurre entre la inserción del nuevo dato y su disponibilidad en el índice. Sin embargo, un enfoque tradicional va degradando su rendimiento cuando se utiliza para indexar microblogs -twitter-, ya que la carga de trabajo -actualización del índice y consulta- aumenta. En el presente trabajo se implementa y evalúa TI -Tweet Index-, un algoritmo para la indexación y búsqueda de tweets en tiempo real. La intuición sobre la cual trabaja TI se basa en que se deben indexar los tweets que tienen una alta probabilidad de ser consultados mientras que los otros tweets pueden ser indexados posteriormente. Los resultados experimentales obtenidos sobre una intuición sobre la cual se basa TI</p>
<p>From the perspective of a searching on a real-time about microblogs, new data must be available for search immediately after its creation. In the traditional databases, the requirement mentioned, can be easily solved by creating an index, which is evaluated by measuring the time lapse between the input of a new data and it`s availability in the index set up. However, a traditional approach degrades its performance when it is used for micrologs index -twitter-, because the workload is increased due to the updating process of indexes and queries. The present paper evaluates and implements TI -Tweet Index-, an algorithm for the process of indexing and searching tweets, on real-time basis. Intuition over which TI works, is based on the need to indexing the tweets that have a high probability to be consulted, meanwhile others tweets can be indexed later. The experimental results is based on intuition TI</p>
last modification
Ingeniero de Ejecución en Informática
INGENIERIA DE EJECUCION INFORMATICA
<p>Desde el punto de vista de una búsqueda en tiempo real sobre microblogs -twitter- nuevos datos deben quedar disponibles para su búsqueda inmediatamente después de su creación. En bases de datos tradicionales el requerimiento antes mencionado puede ser fácilmente satisfecho creando un índice, el cual es evaluado midiendo el intervalo de tiempo que transcurre entre la inserción del nuevo dato y su disponibilidad en el índice. Sin embargo, un enfoque tradicional va degradando su rendimiento cuando se utiliza para indexar microblogs -twitter-, ya que la carga de trabajo -actualización del índice y consulta- aumenta. En el presente trabajo se implementa y evalúa TI -Tweet Index-, un algoritmo para la indexación y búsqueda de tweets en tiempo real. La intuición sobre la cual trabaja TI se basa en que se deben indexar los tweets que tienen una alta probabilidad de ser consultados mientras que los otros tweets pueden ser indexados posteriormente. Los resultados experimentales obtenidos sobre una intuición sobre la cual se basa TI</p>
<p>From the perspective of a searching on a real-time about microblogs, new data must be available for search immediately after its creation. In the traditional databases, the requirement mentioned, can be easily solved by creating an index, which is evaluated by measuring the time lapse between the input of a new data and it`s availability in the index set up. However, a traditional approach degrades its performance when it is used for micrologs index -twitter-, because the workload is increased due to the updating process of indexes and queries. The present paper evaluates and implements TI -Tweet Index-, an algorithm for the process of indexing and searching tweets, on real-time basis. Intuition over which TI works, is based on the need to indexing the tweets that have a high probability to be consulted, meanwhile others tweets can be indexed later. The experimental results is based on intuition TI</p>