Sistemi, programmi, componenti – Archivio Forum Forma Romae

luca

26/02/2018 08:32 · messaggio #12

Esiste già un sistema open source per dati spaziali.

si potrebbe quindi sviluppare a partire da qui
ecco il link http://www.spatialytics.org/projects/geokettle/
potrebbe essere usato insieme con pentao (kettle per alfanumerici open source)
http://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+-+Java+API+Examples
per generare tramite Java delle API utili per definire webservices e microwebservices.
Attenzione però mi pare di capire che il sistema duplica i dati cioè la fase load non è virtuale, ma popola un nuovo DB.
Funzioni analoghe però possiamo ottenerle con Open Shift + Jboss avendo un set di dati virtuali e quindi da non riversare in un datawerhouse come nel caso precedente, cosa che comporterebbe una cache di storage di qualche terabite…. https://developers.openshift.com/jboss-xpaas/data-virtualization.html
E’ anche possibile provare a sviluppare un server ETL ex novo forse partendo da questa macchina virtuale pubblicata dall' università di PISA scaricabile http://www.disit.org/drupal/?q=node/6690
Infine la società informatica ha sviluppato un pacchetto dedicato di cui sarebbe necessario lo sviluppo https://www.informatica.com/content/dam/informatica-com/global/amer/us/collateral/solution-brief/dw-optimization_solution-brief_3269en.pdf ha lo svantaggio di non essere open source, tuttavia ho avuto modo di illustrare l’architettura ad Amedeo Muro, Major Account manager di quella società e mi ha fatto intendere che l’ intero pacchetto con la loro tecnologia si aggirerebbe intorno ai 100.000 euro, infrastruttura esclusa.
Qualche altro link può essere utile sui sistemi a containers che sono una emanazione di open staks https://www.openstack.org/.
Le architetture in giro sono due:
Doker che mi pare sia usato da Google
https://www.docker.com/what-docker
e Kubernetis sviluppato da REDHAT
https://www.redhat.com/it/topics/containers/what-is-kubernetes
il suo orchestratore è Jankins https://jenkins.io/
E' interessante il fatto che tutti i prodotti REDHAT sono in convenzione CONSIP (assistiti H24 per lo sviluppo)
Per il portale prenderei in considerazione Apache hadoop http://hadoop.apache.org/
e per le API https://hive.apache.org/
Infine per i big data il must è sicuramente hadoop se non lo conoscete troppo qui è illustrato bene http://www.html.it/pag/50111/introduzione-ad-hadoop/
altri link prossimamente su richiesta............

renzo

26/02/2018 08:49 · messaggio #13

Hai avuto modo di vedere quanto proponemmo nella nostra offerta?
https://www.archesproject.org/
Certo anche questo è basato su una nuova Banca Dati, che però è organizzata sul Conceptual Model del CIDOC.

luca

26/02/2018 10:41 · messaggio #14

Molto interessante, confesso che non lo conoscevo e che non lo avevo notato nell' offerta (ma tanto mica ho aggiudicato io la gara).
Mi piacerebbe sapere quanto è personalizzabile, se c'è qualche sviluppatore che lo conosce bene e se ci sono installazioni in italia.
Sembra un' ottima interfaccia web, ma non mi pare che dietro abbia un ETL, potrebbe funzionare con dati virtualizzati?
In ogni caso è da tenere presente come framework e mi piacerebbe passare qualche ora con qualcuno degli sviluppatori (anche in videocall se in Italia non ci sono...)
Bisogna anche valutare la sua adattabilità alla nostra architettura dati e considerare che sembra lavorare con pyton piuttosto che con java quindi tutta elaborazione lato server..... Da valutare anche quali webservices e microwebservices offre.
Ho guardato un poco sia wiki che forum e mi pare che l'attenzione sia tutta verso l' interfaccia web.

luca

27/02/2018 11:59 · messaggio #15

Ho iniziato la procedura per una installazione di test e mi sono subito fermato.....
Please note that Arches v4 is only fully supported in Chrome.
poi ho visto anche che usa mapnik 2.2 e non geoserver....
Insomma visto da vicino non mi entusiasma più tanto, facciamoci fare una demo da qualche sviluppatore in modo da potergli fare tutte le domande del caso.