Il motore di feedback

La funzione di feedback è una delle caratteristiche che consentono si affermare che Formaromae è un sistema di AI. Svolge due importanti compiti complementari, da un lato consente la convergenza delle basi dati (su base volontaria) e quindi nel tempo semplifica il meccanismo di deduplica, dall’ altro è il principale motivo che può spingere i gestori di dati ad aderire al sistema perché li ricompensa con un confronto dei loro dati con quelli prodotti da altri.
Vediamo di definire meglio quando si attiverà il feedback e cosa restituirà in caso di ricerca testuale.
Innanzitutto non si avrà feedback per le basi dati che non hanno mappato uno dei campi di risposta, l’ esempio più semplice è una ricerca nel campo localizzazione (indirizzo) il feedback non va inviato a chi non ha tale campo tra quelli mappati poiché è evidente che è fuori dal suo campo di interesse, anche la datazione (l’ insieme dei campi di datazione) potrebbe non rientrare tra quelli mappati in una base dati ecc…..
In caso di risposta della base dati tramite API si prescinde dalla mappatura poiché essa avviene nel sistema host dei dati e quindi il feedback verrà inviato comunque a meno che il gestore dati lo escluda (perché nella sua mappatura interna manca il campo).
L’ unico caso in cui non verrà inviato mai un feedback sarà quando il valore restituito risulterà uguale a quello della base dati vincente.
Si avrà un feedback pertanto solo in questi due casi:
1 se il valore restituito è null
2 se il valore restituito è diverso da quello della base dati vincente
Cosa restituirà il feedback?
L’ intero set di dati pre-deduplica + l’ indicazione del valore ritenuto vincente.
In caso di ricerca geografica occorre valutare se non sia opportuno inviare sempre il feedback relativamente ai dati dei campi testuali o limitarlo solo al caso di oggetti geografici sottoposti a deduplica.
Le regole in tal caso dovrebbero essere le stesse del feedback da ricerca testuale.
In ogni caso il gestore dati deve poter definire una regola che ci esenta dal feedback; penso ad esempio al SITAR che contiene tutti oggetti archeolgici e non può essere subissato di feedback provocati dalla ricerca di chiese barocche…..
In alternativa potremmo affidare al machine learning il compito di stabilire a chi inviare i feedback sulla base dei feedback rifiutati.
Il problema rimane aperto e potrebbe essere risolto a monte escludendo dalla ricerca le basi dati che sappiamo già che non ci risponderanno (appunto SITAR risponderà alla query “monumento a Mazzini” inevitabilmente con NULL). E’ il guaio della ricerca google like che produce inevitabilmente rumore nei feedback.

luca

renzo