diff --git a/robot.js b/robot.js index c237d97..d39b78a 100644 --- a/robot.js +++ b/robot.js @@ -41,10 +41,8 @@ async function main() { } } -// ... (Mantén tus imports y la función main igual) - // ========================================== -// 🏥 MULTIASISTENCIA V6 (LÓGICA DE REBOTE) +// 🏥 MULTIASISTENCIA V7 (EXTRACCIÓN POR PATRONES DE TEXTO) // ========================================== async function runMultiasistencia(ownerId, user, pass) { const browser = await chromium.launch({ headless: HEADLESS, args: ['--no-sandbox'] }); @@ -52,7 +50,7 @@ async function runMultiasistencia(ownerId, user, pass) { const page = await context.newPage(); try { - console.log("🌍 [Multi] Iniciando extracción..."); + console.log("🌍 [Multi] Accediendo..."); await page.goto('https://web.multiasistencia.com/w3multi/acceso.php', { timeout: 60000 }); const userInput = await page.$('input[name="usuario"]') || await page.$('input[type="text"]'); @@ -70,61 +68,65 @@ async function runMultiasistencia(ownerId, user, pass) { return Array.from(new Set(links.map(a => a.href.match(/reparacion=(\d+)/)?.[1]).filter(Boolean))); }); - console.log(`🔍 [Multi] Analizando ${expedientes.length} expedientes.`); + console.log(`🔍 [Multi] Procesando ${expedientes.length} expedientes.`); for (const ref of expedientes) { await page.goto(`https://web.multiasistencia.com/w3multi/repasos1.php?reparacion=${ref}`, { waitUntil: 'domcontentloaded' }); const fullData = await page.evaluate(() => { + const text = document.body.innerText; const data = {}; - // Cogemos todos los elementos que suelen contener texto en Multi - const all = Array.from(document.querySelectorAll('td, b, span, div, font, strong')); - - const labelsToFind = [ - "Número Reparación", "Número de Póliza", "Nombre Cliente", - "Dirección", "Distrito Postal", "Procedencia", - "Descripción de la Reparación", "Tramitador", "Urgente", "Fecha realización" - ]; - labelsToFind.forEach(label => { - // Buscamos el elemento que contiene EXACTAMENTE el texto de la etiqueta - const foundIndex = all.findIndex(el => el.innerText.trim().replace(':', '') === label); - - if (foundIndex !== -1) { - // Multiasistencia a veces pone el valor en el siguiente TD o en el siguiente elemento - // Vamos a saltar hasta 3 posiciones adelante buscando un valor que NO sea otra etiqueta - for (let i = 1; i <= 3; i++) { - const candidate = all[foundIndex + i]; - if (candidate) { - const val = candidate.innerText.trim(); - // Si el valor no es una de nuestras etiquetas y no está vacío, es el dato real - if (val && val.length > 0 && !labelsToFind.includes(val.replace(':', ''))) { - data[label] = val; - break; - } - } - } + // Función para extraer texto entre dos palabras clave + const extract = (start, end) => { + const regex = new RegExp(`${start}\\s*:?\\s*([\\s\\S]*?)(?=${end}|$)`, 'i'); + const match = text.match(regex); + return match ? match[1].trim() : null; + }; + + // CAPTURA POR BLOQUES DE TEXTO (IGNORANDO TABLAS) + data['Número Reparación'] = extract('Número Reparación', 'Número de Póliza'); + data['Número de Póliza'] = extract('Número de Póliza', 'Nombre Cliente'); + data['Nombre Cliente'] = extract('Nombre Cliente', 'Dirección'); + data['Dirección'] = extract('Dirección', 'Baremo'); + data['Distrito Postal'] = extract('Distrito Postal', 'Más información'); + data['Procedencia'] = extract('Procedencia', 'Forma de pago'); + data['Descripción'] = extract('Descripción de la Reparación', 'Urgente'); + data['Tramitador'] = extract('Tramitador', 'Teléfono del Cliente'); + data['Urgente'] = extract('Urgente', 'Fecha realización'); + data['Fecha realización'] = extract('Fecha realización', 'Estado'); + + // Teléfonos (Regex de 9 dígitos limpia) + const phones = text.match(/[6789]\d{8}/g); + if (phones) data['phone_fixed'] = [...new Set(phones)].join(' / '); + + // Limpieza final: si el valor capturado contiene el nombre de otra etiqueta, está mal + const labels = ["Número Reparación", "Dirección", "Nombre Cliente", "Urgente", "Estado"]; + Object.keys(data).forEach(k => { + if (data[k]) { + // Cortamos si se nos ha colado la siguiente etiqueta + labels.forEach(l => { + if (data[k].includes(l)) data[k] = data[k].split(l)[0].trim(); + }); + // Quitamos saltos de línea molestos + data[k] = data[k].replace(/\n/g, ' ').replace(/\s+/g, ' '); } }); - // Extracción de teléfonos (buscando patrones numéricos en todo el texto) - const bodyText = document.body.innerText; - const phones = bodyText.match(/[6789]\d{8}/g); - if (phones) data['phone_fixed'] = [...new Set(phones)].join(' / '); - return data; }); - if (fullData && Object.keys(fullData).length > 0) { + if (fullData && Object.keys(fullData).length > 2) { await saveServiceToDB(ownerId, 'multiasistencia', ref, fullData); } } } catch (e) { - console.error("❌ [Multi] Error:", e.message); + console.error("❌ [Multi] Error Crítico:", e.message); } finally { await browser.close(); } } + // ... (Mantén el resto del archivo igual) // ========================================== // 🧹 HOMESERVE (MANTENIDO)