Actualizar robot.js
This commit is contained in:
78
robot.js
78
robot.js
@@ -41,10 +41,8 @@ async function main() {
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
// ... (Mantén tus imports y la función main igual)
|
|
||||||
|
|
||||||
// ==========================================
|
// ==========================================
|
||||||
// 🏥 MULTIASISTENCIA V6 (LÓGICA DE REBOTE)
|
// 🏥 MULTIASISTENCIA V7 (EXTRACCIÓN POR PATRONES DE TEXTO)
|
||||||
// ==========================================
|
// ==========================================
|
||||||
async function runMultiasistencia(ownerId, user, pass) {
|
async function runMultiasistencia(ownerId, user, pass) {
|
||||||
const browser = await chromium.launch({ headless: HEADLESS, args: ['--no-sandbox'] });
|
const browser = await chromium.launch({ headless: HEADLESS, args: ['--no-sandbox'] });
|
||||||
@@ -52,7 +50,7 @@ async function runMultiasistencia(ownerId, user, pass) {
|
|||||||
const page = await context.newPage();
|
const page = await context.newPage();
|
||||||
|
|
||||||
try {
|
try {
|
||||||
console.log("🌍 [Multi] Iniciando extracción...");
|
console.log("🌍 [Multi] Accediendo...");
|
||||||
await page.goto('https://web.multiasistencia.com/w3multi/acceso.php', { timeout: 60000 });
|
await page.goto('https://web.multiasistencia.com/w3multi/acceso.php', { timeout: 60000 });
|
||||||
|
|
||||||
const userInput = await page.$('input[name="usuario"]') || await page.$('input[type="text"]');
|
const userInput = await page.$('input[name="usuario"]') || await page.$('input[type="text"]');
|
||||||
@@ -70,61 +68,65 @@ async function runMultiasistencia(ownerId, user, pass) {
|
|||||||
return Array.from(new Set(links.map(a => a.href.match(/reparacion=(\d+)/)?.[1]).filter(Boolean)));
|
return Array.from(new Set(links.map(a => a.href.match(/reparacion=(\d+)/)?.[1]).filter(Boolean)));
|
||||||
});
|
});
|
||||||
|
|
||||||
console.log(`🔍 [Multi] Analizando ${expedientes.length} expedientes.`);
|
console.log(`🔍 [Multi] Procesando ${expedientes.length} expedientes.`);
|
||||||
|
|
||||||
for (const ref of expedientes) {
|
for (const ref of expedientes) {
|
||||||
await page.goto(`https://web.multiasistencia.com/w3multi/repasos1.php?reparacion=${ref}`, { waitUntil: 'domcontentloaded' });
|
await page.goto(`https://web.multiasistencia.com/w3multi/repasos1.php?reparacion=${ref}`, { waitUntil: 'domcontentloaded' });
|
||||||
|
|
||||||
const fullData = await page.evaluate(() => {
|
const fullData = await page.evaluate(() => {
|
||||||
|
const text = document.body.innerText;
|
||||||
const data = {};
|
const data = {};
|
||||||
// Cogemos todos los elementos que suelen contener texto en Multi
|
|
||||||
const all = Array.from(document.querySelectorAll('td, b, span, div, font, strong'));
|
|
||||||
|
|
||||||
const labelsToFind = [
|
|
||||||
"Número Reparación", "Número de Póliza", "Nombre Cliente",
|
|
||||||
"Dirección", "Distrito Postal", "Procedencia",
|
|
||||||
"Descripción de la Reparación", "Tramitador", "Urgente", "Fecha realización"
|
|
||||||
];
|
|
||||||
|
|
||||||
labelsToFind.forEach(label => {
|
// Función para extraer texto entre dos palabras clave
|
||||||
// Buscamos el elemento que contiene EXACTAMENTE el texto de la etiqueta
|
const extract = (start, end) => {
|
||||||
const foundIndex = all.findIndex(el => el.innerText.trim().replace(':', '') === label);
|
const regex = new RegExp(`${start}\\s*:?\\s*([\\s\\S]*?)(?=${end}|$)`, 'i');
|
||||||
|
const match = text.match(regex);
|
||||||
if (foundIndex !== -1) {
|
return match ? match[1].trim() : null;
|
||||||
// Multiasistencia a veces pone el valor en el siguiente TD o en el siguiente elemento
|
};
|
||||||
// Vamos a saltar hasta 3 posiciones adelante buscando un valor que NO sea otra etiqueta
|
|
||||||
for (let i = 1; i <= 3; i++) {
|
// CAPTURA POR BLOQUES DE TEXTO (IGNORANDO TABLAS)
|
||||||
const candidate = all[foundIndex + i];
|
data['Número Reparación'] = extract('Número Reparación', 'Número de Póliza');
|
||||||
if (candidate) {
|
data['Número de Póliza'] = extract('Número de Póliza', 'Nombre Cliente');
|
||||||
const val = candidate.innerText.trim();
|
data['Nombre Cliente'] = extract('Nombre Cliente', 'Dirección');
|
||||||
// Si el valor no es una de nuestras etiquetas y no está vacío, es el dato real
|
data['Dirección'] = extract('Dirección', 'Baremo');
|
||||||
if (val && val.length > 0 && !labelsToFind.includes(val.replace(':', ''))) {
|
data['Distrito Postal'] = extract('Distrito Postal', 'Más información');
|
||||||
data[label] = val;
|
data['Procedencia'] = extract('Procedencia', 'Forma de pago');
|
||||||
break;
|
data['Descripción'] = extract('Descripción de la Reparación', 'Urgente');
|
||||||
}
|
data['Tramitador'] = extract('Tramitador', 'Teléfono del Cliente');
|
||||||
}
|
data['Urgente'] = extract('Urgente', 'Fecha realización');
|
||||||
}
|
data['Fecha realización'] = extract('Fecha realización', 'Estado');
|
||||||
|
|
||||||
|
// Teléfonos (Regex de 9 dígitos limpia)
|
||||||
|
const phones = text.match(/[6789]\d{8}/g);
|
||||||
|
if (phones) data['phone_fixed'] = [...new Set(phones)].join(' / ');
|
||||||
|
|
||||||
|
// Limpieza final: si el valor capturado contiene el nombre de otra etiqueta, está mal
|
||||||
|
const labels = ["Número Reparación", "Dirección", "Nombre Cliente", "Urgente", "Estado"];
|
||||||
|
Object.keys(data).forEach(k => {
|
||||||
|
if (data[k]) {
|
||||||
|
// Cortamos si se nos ha colado la siguiente etiqueta
|
||||||
|
labels.forEach(l => {
|
||||||
|
if (data[k].includes(l)) data[k] = data[k].split(l)[0].trim();
|
||||||
|
});
|
||||||
|
// Quitamos saltos de línea molestos
|
||||||
|
data[k] = data[k].replace(/\n/g, ' ').replace(/\s+/g, ' ');
|
||||||
}
|
}
|
||||||
});
|
});
|
||||||
|
|
||||||
// Extracción de teléfonos (buscando patrones numéricos en todo el texto)
|
|
||||||
const bodyText = document.body.innerText;
|
|
||||||
const phones = bodyText.match(/[6789]\d{8}/g);
|
|
||||||
if (phones) data['phone_fixed'] = [...new Set(phones)].join(' / ');
|
|
||||||
|
|
||||||
return data;
|
return data;
|
||||||
});
|
});
|
||||||
|
|
||||||
if (fullData && Object.keys(fullData).length > 0) {
|
if (fullData && Object.keys(fullData).length > 2) {
|
||||||
await saveServiceToDB(ownerId, 'multiasistencia', ref, fullData);
|
await saveServiceToDB(ownerId, 'multiasistencia', ref, fullData);
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
} catch (e) {
|
} catch (e) {
|
||||||
console.error("❌ [Multi] Error:", e.message);
|
console.error("❌ [Multi] Error Crítico:", e.message);
|
||||||
} finally {
|
} finally {
|
||||||
await browser.close();
|
await browser.close();
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
// ... (Mantén el resto del archivo igual)
|
// ... (Mantén el resto del archivo igual)
|
||||||
// ==========================================
|
// ==========================================
|
||||||
// 🧹 HOMESERVE (MANTENIDO)
|
// 🧹 HOMESERVE (MANTENIDO)
|
||||||
|
|||||||
Reference in New Issue
Block a user