Foro sobre Java SE > Busqueda OnLine
Creo que ya esta resuelto.
Un saludo
Muy buenas, me temo que aún no puedo celebrar haber solucionado mis problemas pues en la ultima pagina que me queda por volcar información tengo problemas, dado que no logro conseguir el acceso, no hay paquete con metodo POST, sino GET y pensé que se procedería de manera semejante pero no parece ser así.
Por ejemplo:
Pagina inicial
https://dbh.nsd.uib.no/publiseringskanaler/erihplus/index
Ahora busco el ISSN 0034-8082, obteniendo:
https://dbh.nsd.uib.no/publiseringskanaler/erihplus/search.action?enkeltSok=0034-8082&sok.discipline=-1&treffliste.tidsskriftTreffside=1&treffliste.vis=true
Donde debo pinchar en el enlace para obtener la información definitiva:
https://dbh.nsd.uib.no/publiseringskanaler/erihplus/periodical/info.action?id=481663
Me he fijado que la URL de la información definitiva para cada revista es idéntica salvo el "id" (id=481663 en este caso) he intentado obtenerlo pero desconozco la manera.
Perdón por las molestias y gracias ;).
Un saludo.
hola sitorbj, que me alegro que te este sirviendo mi ayuda.
si te entiendo bien tu ultimo problema, es que los resultados, te los da como otro link que te coloca en la pagina, como el ejemplo que has colgado?
bueno de ser asi ahi ya entra jsoup tendras que leer hasta encontrar ese link.
lo bueno que tiene un patron asi te ser facil entontrarlo con jsoup.
una ves encontrado pues nada, haces lo mismo
Document doc = Jsoup.connect(linkEncontrado).get();
En la pagina de jsoup hay esto creo que es lo que quieres.
claro aqui solo es el primero, debes obtener todos los link (elemento a) y verificar que sea el que tu buscas.
Element link = doc.select("a").first();
String relHref = link.attr("href"); // == "/"
para buscar puedes usar el metodo contains o indexof de String.
bueno me cuentas.
saludos.
Muy buenas, de nuevo te tengo que agradecer tu inestimable colaboracion y ayuda, pues estabas en lo cierto, pasando las cookies consigo acceder un paso mas adelante, pero de nuevo me surgen problemas debido a mi inexperiencia al trabajar con paginas web, por lo tanto pido disculpas por ser tan "pesado".
Como dije antes quiero acceder a una Web que me presenta los resultados que necesito, para acceder a dicha web debo:
Paso 1-iniciar sesión haciendo (o simulando) "click" en el enlace. Esto ya lo he conseguido.
Paso 2-especificar búsqueda, por ejemplo si busco una revista o varias. Conseguido gracias a la aportación de las cookies.
Paso 3-Lanzar búsqueda definitiva para extraer información. No conseguido.
El problema es que consigo situarme en la web de Paso 3, pero al hacer la conexión con los parámetros que obtengo (mediante el network) me carga de nuevo la web del paso 3 en vez de la web de los resultados definitivos, he probado varias cosas y estoy atrancado.
Un saludo.