Por loren Portable | junio 8th, 2017

WebHarvy v4.1.5.141Portable


WebHarvy Portable

WebHarvy Portable es una práctica aplicación diseñada para permitirle extraer automáticamente datos de páginas web y guardar el contenido extraído en diferentes formatos.

Con WebHarvy Portable, la captura de datos desde páginas web es tan fácil como navegar a las páginas que contienen datos y hacer clic en los datos que se van a capturar.

WebHarvy identificará inteligentemente los patrones de datos que se producen en las páginas web. Asemás, puede extraer datos como catálogos de productos o resultados de búsqueda de una variedad de sitios web que pertenecen a diferentes categorías como Bienes Raíces, Comercio Electrónico, Investigación Académica, Entretenimiento, Tecnología, etc.

Notas de la versión

Los datos extraídos de las páginas web se pueden guardar en una variedad de formatos. A menudo, las páginas web muestran datos como resultados de búsqueda en varias páginas. WebHarvy Portable puede rastrear y extraer automáticamente datos de varias páginas.

Caracteristicas:

Interfaz Visual Point & Click
No hay absolutamente ninguna necesidad de escribir scripts o código para raspar datos. Usted utilizará el navegador integrado de WebHarvy para navegar por las páginas web. Puede seleccionar los datos a raspar con clics del ratón.
Los patrones de datos Scrape identifican de forma inteligente los patrones
Identifica automáticamente los patrones de datos que se producen en las páginas web. Así que si necesita raspar una lista de elementos (nombre, dirección, correo electrónico, precio, etc) de una página web, no necesita hacer ninguna configuración adicional. Si los datos se repiten, WebHarvy lo raspará automáticamente.

Exportar datos raspados Exportar datos capturados
Puede guardar los datos extraídos de las páginas web en una variedad de formatos. La versión actual de WebHarvy Web Scraper le permite exportar los datos raspados como un archivo XML, CSV, JSON o TSV. También puede exportar los datos raspados a una base de datos SQL.

Raspe datos de varias páginas Raspe desde varias páginas
A menudo, las páginas web muestran datos como listas de productos en varias páginas. WebHarvy puede rastrear y extraer automáticamente datos de varias páginas. Simplemente señale el ‘enlace a la página siguiente’ y WebHarvy Web Scraper raspará automáticamente los datos de todas las páginas.

Palabra clave basada en raspado Palabra clave basada en raspado
El raspado basado en palabras clave le permite capturar datos de las páginas de resultados de búsqueda para obtener una lista de palabras clave de entrada. La configuración que cree se repetirá automáticamente para todas las palabras clave de entrada durante la minería de datos. Se puede especificar cualquier número de palabras clave de entrada.

Scrape a través de servidor proxy Scrape a través de servidores proxy
Para borrar de forma anónima y evitar que el software de raspado web se bloquee en los servidores web, tiene la opción de acceder a sitios web de destino a través de servidores proxy. Se puede utilizar una sola dirección de servidor proxy o una lista de direcciones de servidor proxy. (Saber más)

Categorías
WebHarvy Portable le permite borrar datos de una lista de enlaces que lleva a páginas similares dentro de un sitio web. Esto le permite borrar categorías o subsecciones dentro de sitios web usando una sola configuración. (Saber más) (Video)

Buscar con expresiones regulares
El poprtable le permite aplicar expresiones regulares (RegEx) en fuentes de texto o HTML de páginas web y raspar la parte correspondiente. Esta poderosa técnica le ofrece más flexibilidad mientras raspa los datos.

Lanzamiento Nuevo

NUEVO
Formato de archivo de configuración WebHarvy (XML)
Los archivos de configuración de WebHarvy se guardan en formato XML. A continuación se muestra la descripción del formato de archivo XML de configuración de WebHarvy. Los usuarios avanzados pueden ajustar directamente el archivo de configuración XML creado.
Cambiar la mayoría de los detalles en la configuración directamente desde la interfaz de usuario. Consulte Edición de la configuración para obtener más detalles. Esto le permite cambiar fácilmente los parámetros de configuración sin editar manualmente el archivo XML.
Este documento proporciona sólo una descripción de alto nivel del formato de archivo de configuración y no está completo. Por favor, póngase en contacto con nuestro Soporte en caso de que necesite más información.

Encabezamiento
La parte del encabezado del archivo de configuración es la siguiente. Esta porción es la misma para todos los archivos de configuración.
Detalles de la URL
La siguiente etiqueta StartURL describe la URL de la página desde la que comienza el proceso de raspado de datos. La etiqueta url dentro de StartURL contiene la URL de la página web


MAS INFORMACION

Año: 2017
Versión: 4.1.5.14
Sistema: XP/Vista/7/8/en Windows 10 es POSIBLE, PERO NO GARANTIZADO!
Idioma: Ingles
Tamaño: 5.55 MB
Formato: Rar
Ejecutar como administrador: No es necesario

Para descargar esperar 5 segundos y dar clic en la pestaña de

SERVIDORES DE DESCARGA

Leave a Reply