-
Notifications
You must be signed in to change notification settings - Fork 4
/
Copy pathindex.html
1111 lines (875 loc) · 50 KB
/
index.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
<!doctype html>
<html lang="en">
<head>
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no">
<title>Servicios de datos en la estadística pública</title>
<meta name="description" content="Servicios de datos en la estadística pública">
<meta name="author" content="Miguel Expósito Martín">
<meta name="apple-mobile-web-app-capable" content="yes" />
<meta name="apple-mobile-web-app-status-bar-style" content="black-translucent" />
<meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no, minimal-ui">
<link rel="stylesheet" href="css/reveal.css">
<link rel="stylesheet" href="css/theme/simple.css">
<link rel="stylesheet" href="css/custom.css">
<!-- Code syntax highlighting -->
<link rel="stylesheet" href="lib/css/zenburn.css">
<!-- Printing and PDF exports -->
<script>
var link = document.createElement( 'link' );
link.rel = 'stylesheet';
link.type = 'text/css';
link.href = window.location.search.match( /print-pdf/gi ) ? 'css/print/pdf.css' : 'css/print/paper.css';
document.getElementsByTagName( 'head' )[0].appendChild( link );
</script>
<!--[if lt IE 9]>
<script src="lib/js/html5shiv.js"></script>
<![endif]-->
</head>
<body>
<div class="reveal">
<!-- Any section element inside of this container is displayed as a slide -->
<div class="slides">
<section data-id="1">
<h3>Servicios de datos en la estadística pública</h3>
<div style="line-height: 1.5em; text-align: center;">
<img alt="Cantabria cloud" src="./img/cantabria_cloud.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); " />
</div>
</section>
<section data-markdown>
<script type="text/template">
## Hoja de ruta
1. Administración pública, ciencia de datos y oficinas estadísticas: caso de Cantabria
2. Procesos ETL
3. Caso de uso: directorio de empresas y establecimientos de Cantabria
4. Bancos de datos estadísticos
5. Visualización de datos
6. Web semántica y datos estadísticos abiertos y enlazados
</script>
</section>
<section>
<section data-markdown>
<script type="text/template">
## Oficinas estadísticas públicas
Producción, recopilación, análisis y difusión de estadísticas sobre la economía, sociedad y población de una región.<!-- .element: class="fragment" data-fragment-index="1" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Oficinas estadísticas públicas
Administrativamente, son organismos independientes apoyados por legislación en materia de Estadística Pública.
</script>
</section>
<section data-markdown data-transition="fade-in none-out">
<script type="text/template">
## Organización
![Organigrama](./img/organigrama1.svg)
</script>
</section>
<section data-markdown data-transition="none-in none-out">
<script type="text/template">
## Organización
![Organigrama](./img/organigrama2.svg)
</script>
</section>
<section data-markdown data-transition="none-in none-out">
<script type="text/template">
## Organización
![Organigrama](./img/organigrama3.svg)
</script>
</section>
<section data-markdown data-transition="none-in none-out">
<script type="text/template">
## Organización
![Organigrama](./img/organigrama4.svg)
</script>
</section>
<section data-markdown data-transition="none-in none-out">
<script type="text/template">
## Organización
![Organigrama](./img/organigrama5.svg)
</script>
</section>
<section data-markdown data-transition="none-in none-out">
<script type="text/template">
## Organización
![Organigrama](./img/organigrama6.svg)
</script>
</section>
<section data-markdown data-transition="none-in fade-out">
<script type="text/template">
## Organización
![Organigrama](./img/organigrama7.svg)
</script>
</section>
<section data-background="http://media.giphy.com/media/145onU7HWQYtlm/giphy.gif" >
<h2 style="color:white;font-weight: bold;">Los estadísticos implementan los modelos y obtienen las predicciones...</h3>
</section>
<section data-background="https://media.giphy.com/media/XrJmqB5f8sfhC/giphy.gif" >
<h2 style="color:white;font-weight: bold;">... y los informáticos ponen a su disposición los datos</h3>
</section>
<section data-markdown>
<script type="text/template">
## Ciencia de datos en estadística pública
Existen varias competencias esenciales que no quedan necesariamente cubiertas por estadísticos e informáticos<!-- .element: class="fragment" data-fragment-index="1" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Nuevas competencias
- Calidad de datos<!-- .element: class="fragment" data-fragment-index="1" -->
- Privacidad de datos (statistical disclosure control)<!-- .element: class="fragment" data-fragment-index="2" -->
- Difusión de datos y metadatos<!-- .element: class="fragment" data-fragment-index="3" --> ([SDMX](https://sdmx.org/)<!-- .element: class="fragment" data-fragment-index="3" -->, [JSON-stat](https://json-stat.org/))<!-- .element: class="fragment" data-fragment-index="3" -->
- Modelos de procesos estadísticos (<!-- .element: class="fragment" data-fragment-index="4" -->[GSBPM](https://statswiki.unece.org/display/GSBPM/GSBPM+v5.0))<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Nuevas competencias
- Modelos de metadatos (<!-- .element: class="fragment" data-fragment-index="1" -->[DCAT](https://www.w3.org/TR/vocab-dcat/)<!-- .element: class="fragment" data-fragment-index="1" -->, [Dublin Core](http://dublincore.org/))<!-- .element: class="fragment" data-fragment-index="1" -->
- NLP (ejemplo: <!-- .element: class="fragment" data-fragment-index="2" -->[chatbot del ISTAC](https://twitter.com/istac_bot?lang=es)<!-- .element: class="fragment" data-fragment-index="2" -->)<!-- .element: class="fragment" data-fragment-index="2" -->
- APIs REST<!-- .element: class="fragment" data-fragment-index="3" -->
- Tratamiento de datos en Python y R<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Nuevas competencias
- Sistemas OLAP<!-- .element: class="fragment" data-fragment-index="1" -->
- Nuevas fuentes y big data<!-- .element: class="fragment" data-fragment-index="2" -->
- Bases de datos NoSQL<!-- .element: class="fragment" data-fragment-index="3" -->
- Linked open data<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Actuaciones en marcha
Creación de especialidades de científico de datos y técnico de ciencia de datos en cuerpos de la Administración Pública<!-- .element: class="fragment" data-fragment-index="1" -->
[Oficina del dato](https://www.boe.es/eli/es/o/2020/07/31/etd803)<!-- .element: class="fragment" data-fragment-index="2" -->
</script>
</section>
<section data-background="https://media.giphy.com/media/4aKWhznBC3Z0A/giphy.gif" >
<h2 style="color:white;font-weight: bold;">Se necesitan perfiles híbridos</h2>
</section>
<section data-markdown>
<script type="text/template">
## El ICANE
- Organismo Autónomo del Gobierno de Cantabria<!-- .element: class="fragment" data-fragment-index="1" -->
- Ley 4/2005, de 5 de octubre, de Estadística de Cantabria<!-- .element: class="fragment" data-fragment-index="2" -->
- Áreas de estadística e informática *<!-- .element: class="fragment" data-fragment-index="3" -->
- Principios recogidos en el<!-- .element: class="fragment" data-fragment-index="4" --> [código de buenas prácticas en las estadísticas europeas](http://www.icane.es/icane/good-practices)<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
### El área de Informática Estadística del Gobierno de Cantabria:<!-- .slide: style="font-size: 30px;"-->
- Funcionarios de perfiles mixtos: estadística, informática (grados y ciclos formativos)<!-- .element: class="fragment" data-fragment-index="1" -->
- Becas de formación en áreas estadística e informática<!-- .element: class="fragment" data-fragment-index="2" -->
- Apuesta por una nueva línea de trabajo para el tratamiento de datos en el Gobierno de Cantabria<!-- .element: class="fragment" data-fragment-index="3" -->
- Depende directamente de la Dirección General de Organización y Tecnología<!-- .element: class="fragment" data-fragment-index="4" -->
- Otras tareas: contratación de bienes y servicios TIC, asesoramiento en RGPD y ENS, análisis de otras aplicaciones corporativas (Subvenciones, Contabilidad, etc.)<!-- .element: class="fragment" data-fragment-index="5" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
### Ejemplo: PIB de Cantabria (CTC)<!-- .slide: style="font-size: 30px;"-->
- Estadística trimestral partiendo de otras relacionadas con actividad económica y CRE<!-- .element: class="fragment" data-fragment-index="1" -->
- Predicción a más largo plazo para la <!-- .element: class="fragment" data-fragment-index="2" -->[AIReF](http://www.airef.es/inicio): <!-- .element: class="fragment" data-fragment-index="2" -->
+ Análisis factorial: <!-- .element: class="fragment" data-fragment-index="3" -->
- indicadores con mayor correlación + PIB<!-- .element: class="fragment" data-fragment-index="4" -->
- se calcula un factor con los indicadores <!-- .element: class="fragment" data-fragment-index="5" -->
+ BVAR: PIB estimado a partir de valores presentes y pasados y del resto de indicadores, incorporando información a priori (hipótesis de país pequeño) <!-- .element: class="fragment" data-fragment-index="7" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Ejemplo: simulación pastoral para montes
- Inputs: Mapas de montes, ortofotos, clima, suelos, vegetación, MET...<!-- .element: class="fragment" data-fragment-index="1" -->
- Outputs: simulación de suelo, plantas y herbívoros<!-- .element: class="fragment" data-fragment-index="2" -->
Arquitectura mixta Rserver + Spring (Java)<!-- .element: class="fragment" data-fragment-index="3" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Otros ejemplos<!-- .slide: style="font-size: 30px;"-->
- Visor de estadísticas de Administración Electrónica para DG Organización y Tecnología<!-- .element: class="fragment" data-fragment-index="1" -->
- Piloto de observatorio de políticas sociales para el Gobierno de Cantabria<!-- .element: class="fragment" data-fragment-index="2" -->
- Estudio del impacto en la empleabilidad de parados de los cursos de formación del Servicio Cántabro de Empleo<!-- .element: class="fragment" data-fragment-index="3" -->
- Búsqueda de correlaciones entre causas de muerte y localización geográfica en Santander para el proyecto<!-- .element: class="fragment" data-fragment-index="4" --> [MEDEA](http://www.proyectomedea.org/)<!-- .element: class="fragment" data-fragment-index="4" -->
- Visor de los Presupuestos Generales de la CA de Cantabria<!-- .element: class="fragment" data-fragment-index="5" -->
- Predicción de ingresos tributarios de ITP/AJD en función de indicadores del sector inmobiliario<!-- .element: class="fragment" data-fragment-index="6" -->
</script>
</section>
</section>
<section>
<section data-markdown>
<script type="text/template">
## Procesos ETL
- Extract: desde fuentes heterogéneas <!-- .element: class="fragment" data-fragment-index="1" -->
- Transform: adaptación a la estructura de destino<!-- .element: class="fragment" data-fragment-index="2" -->
- Load: carga en base de datos destino<!-- .element: class="fragment" data-fragment-index="3" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Algunos números
- 2500 series de datos, 7K tablas, 15M registros
- 2000 tablas de microdatos, 250M registros
- Al año, se actualizan, al menos, en torno a la mitad de las series
- 50 GB de microdatos y 3 GB de agregados
</script>
</section>
<section data-markdown>
<script type="text/template">
## Ejemplo: fichero posicional
006TO606859000010101010001 0916010317241 360001000061 0100160126 0210033333333661666666032001024170612103
006TO6068590000201010301025101 042102031 10000000 2 1 04572246 0318033223333116666666025001377525292114
006TO6068590000202020301025101 0406010567241 2110000000 3 11 09317026 0318033223333116666666025001377525292114
006TO6068590000203030301025101 018603046 6 0318033223333116666666025001377525292114
006TO6068590000204510301025101 0101030267241 6 0318033223333116666666025001377525292114
006TO606859000030101020002 01023107031 10000000 2 1 04571246 0318033223333616666666026001791887862104
006TO606859000030202020002 010231010467241 1610000000 2 11 04571246 0318033223333616666666026001791887862104
006TO606859000040101020002 01 072602031 0001000061 00160126 0304833233333661666666033000902854152103
006TO606859000040202020002 01 0701010367241 210001000061 0206086346 0304833233333661666666033000902854152103
</script>
</section>
<section data-markdown>
<script type="text/template">
## Ejemplo: diseño de registro <!-- .slide: style="font-size: 30px;"-->
|VARIABLE |LONGITUD|POSICIÓN INICIO|POSICIÓN FIN|VALORES VÁLIDOS|
|---------|--------|---------------|------------|---------------|
|NIVEL|1|1|1|0
|CCAA|2|2|3|6
|DOMI|2|4|5|LA, RE, SA, TO
|ESTRATO|1|6|6|0 a 6
|SECCION|4|7|10|0685 a 0808
</script>
</section>
<section data-markdown>
<script type="text/template">
## Evolución: scripting manual
- Scripts en Perl, Oracle sql loader<!-- .element: class="fragment" data-fragment-index="1" -->
- Intervención humana<!-- .element: class="fragment" data-fragment-index="2" -->
- Dificultad de depuración de errores<!-- .element: class="fragment" data-fragment-index="3" -->
- Procedimientos heterogéneos<!-- .element: class="fragment" data-fragment-index="4" -->
- Elevado tiempo de preparación y carga<!-- .element: class="fragment" data-fragment-index="5" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
![Proceso ETL antiguo](./img/etl_1.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
![Proceso ETL antiguo](./img/etl_2.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
## Evolución: integración de datos en Java
- Pentaho Data Integration (aka Kettle, ahora también Apache HOP)<!-- .element: class="fragment" data-fragment-index="1" -->
- Trabajos, transformaciones y pasos<!-- .element: class="fragment" data-fragment-index="2" -->
- Facilidad de uso con GUI<!-- .element: class="fragment" data-fragment-index="3" -->
- Completo catálogo de pasos de transformación<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Flujo de trabajo
![Proceso ETL Kettle](./img/etl_kettle.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
## Ejemplo: IPC
![Job IPC](./img/ipc_job_1.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
## Ejemplo: IPC
![Transforamción IPC](./img/ipc_tx_1.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
## No exento de problemas...
- Problemas de compatibilidad entre versiones<!-- .element: class="fragment" data-fragment-index="1" -->
- Bugs y errores difíciles de trazar<!-- .element: class="fragment" data-fragment-index="2" -->
- Problemas de rendimiento debidos a la facilidad para hacer las cosas mal<!-- .element: class="fragment" data-fragment-index="3" -->
- Pobre integración con control de versiones *<!-- .element: class="fragment" data-fragment-index="4" -->
- Falta de control sobre el proceso de manipulación<!-- .element: class="fragment" data-fragment-index="5" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Evolución: Python
- Diseño modular flexible<!-- .element: class="fragment" data-fragment-index="1" -->
- Énfasis en configuración<!-- .element: class="fragment" data-fragment-index="2" -->
- Control total sobre la depuración de errores<!-- .element: class="fragment" data-fragment-index="3" -->
- Auténtica reutilización<!-- .element: class="fragment" data-fragment-index="4" -->
- Curva de aprendizaje suave<!-- .element: class="fragment" data-fragment-index="5" -->
- Patrones de diseño claros para hacer las cosas bien<!-- .element: class="fragment" data-fragment-index="6" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
### Utilidades ([etlstat](https://github.com/icane/etlstat))
- Extractores masivos de datos<!-- .element: class="fragment" data-fragment-index="1" -->
- Operaciones en base de datos<!-- .element: class="fragment" data-fragment-index="2" -->
- Conversión de formatos <!-- .element: class="fragment" data-fragment-index="3" -->([Pc-axis](https://www.scb.se/sv_/PC-Axis/Start/))<!-- .element: class="fragment" data-fragment-index="3" -->
- Creación de los conectores de base de datos<!-- .element: class="fragment" data-fragment-index="4" -->
- Soporte para MySQL, Oracle, PostreSQL<!-- .element: class="fragment" data-fragment-index="5" -->
- Logging<!-- .element: class="fragment" data-fragment-index="6" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
### Carga y actualización de datos
- Cada carga, en un repositorio<!-- .element: class="fragment" data-fragment-index="1" -->
- Cada carga, un paquete<!-- .element: class="fragment" data-fragment-index="2" -->
- Varios módulos por carga<!-- .element: class="fragment" data-fragment-index="3" -->
- Configuración en módulos basada en diccionarios<!-- .element: class="fragment" data-fragment-index="4" -->
- Datos brutos y de negocio en unidad remota<!-- .element: class="fragment" data-fragment-index="5" -->
- Lanzadores para ejecución en distintos entornos utilizando integración continua y contenedores ligeros<!-- .element: class="fragment" data-fragment-index="6" -->
</script>
</section>
</section>
<section>
<section data-markdown>
<script type="text/template">
## Caso de uso: direcan
![Workflow Directorio](./img/directorio.svg)
[Ver difusión de resultados](https://www.icane.es/direcan)
</script>
</section>
<section data-markdown>
<script type="text/template">
### Geocodificación de direcciones postales
geocodificador múltiple
- Facilitar el proceso de geocodificación <!-- .element: class="fragment" data-fragment-index="1" -->
- Integrar diversos proveedores <!-- .element: class="fragment" data-fragment-index="2" -->
- Mejorar la fiabilidad de los resultados finales <!-- .element: class="fragment" data-fragment-index="3" -->
- Ponerlo en valor <!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-id="1" data-markdown>
<script type="text/template">
## Tecnología
- <!-- .element: class="fragment" data-fragment-index="1" -->[Python 3.5](https://www.python.org/) <!-- .element: class="fragment" data-fragment-index="1" -->
- <!-- .element: class="fragment" data-fragment-index="2" -->[Geocoder 1.23.2](https://geocoder.readthedocs.io/) <!-- .element: class="fragment" data-fragment-index="2" -->
- <!-- .element: class="fragment" data-fragment-index="3" -->[Shapely](https://pypi.org/project/Shapely/)<!-- .element: class="fragment" data-fragment-index="3" -->,<!-- .element: class="fragment" data-fragment-index="3" --> [scikit-learn](http://scikit-learn.org/stable/) <!-- .element: class="fragment" data-fragment-index="3" -->
</script>
</section>
<section data-id="1" data-markdown>
<script type="text/template">
## Entorno urbano <!-- .slide: style="font-size: 30px;"-->
|Mejor (%)|Ok|Cerca|Indeterminado|Error|Revisión|Total|
|----------|-----:|------------:|-----:|------------:|---:|-----:|
|google|36,6|1,5|1,3|0,8|0,0|**40,2**|
|cartociudadV2|29,0|1,0|0,6|1,6|0,0|**32,2**|
|cartociudadV1|25,5|0,9|0,7|0,3|0,0|**27,4**|
|revisión|0,0|0,0|0,0|0,0|0,2|**0,2**|
|**Total**|**91,1** <!-- .element: class="fragment highlight-blue" data-fragment-index="1"-->|**3,4** <!-- .element: class="fragment highlight-blue" data-fragment-index="1"-->|**2,6**|**2,7**|**0,2**|**100,0**|
</script>
</section>
<section data-id="1" data-markdown>
<script type="text/template">
## Entorno rural <!-- .slide: style="font-size: 30px;"-->
|Mejor (%)|Ok|Cerca|Indeterminado|Error|Revisión|Total|
|----------|-----:|------------:|-----:|------------:|---:|-----:|
|google|32,2|3,6|4,4|1,7|0,0|**41,9**|
|cartociudadV2|19,6|2,7|2,0|1,8|0,0|**26,1**|
|cartociudadV1|16,2|2,7|1,6|0,6|0,0|**21,1**|
|revisión|0,0|0,0|0,0|0,0|10,9|**10,9**|
|**Total**|**68,0** <!-- .element: class="fragment highlight-blue" data-fragment-index="1"-->|**9,0** <!-- .element: class="fragment highlight-blue" data-fragment-index="1"-->|**8,0**|**4,1**|**10,9**|**100,0**|
</script>
</section>
<section data-id="1" data-markdown>
<script type="text/template">
## Precisión (P)
|Precisión (%)|Google|Metageocodificador|
|----------|-----:|------------:|
|Entornos rurales|92,0|95,0 <!-- .element: class="fragment highlight-blue" data-fragment-index="1"-->|
|Entornos urbanos|97,1|97,2 <!-- .element: class="fragment highlight-blue" data-fragment-index="1"-->|
P = VP / (VP + FP)
- *VP: Verdaderos Positivos*
- *FP: Falsos Positivos*
</script>
</section>
</section>
</section>
<section data-id="3">
<section data-markdown>
<script type="text/template">
## Bancos de datos
Plataformas web de consulta, extracción y difusión de datos estadísticos<!-- .element: class="fragment" data-fragment-index="1" -->
** Generalmente, en forma de tablas **<!-- .element: class="fragment" data-fragment-index="2" -->
</script>
</section>
<section data-id="3a">
<h3>
<a href="http://www.icane.es/data/quarterly-accounting-cantabria-base-2010-current-prices#timeseries" >formatos de difusión</a>
</h3>
<table style="font-size:20px">
<thead>
<tr>
<th></th>
<th>Consumo</th>
<th>Complejidad</th>
<th>Popularidad</th>
<th>Metadata</th>
</tr>
</thead>
<tbody>
<tr>
<td><img alt="Icono xls" title="Excel" src="./img/xls.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); width:64px; height:64px; vertical-align:middle;" />
</td>
<td>manual</td>
<td><span class="fragment highlight-green" data-fragment-index="1">baja</span></td>
<td><span class="fragment highlight-green" data-fragment-index="1">muy alta</span> </td>
<td>alta</td>
</tr>
<tr>
<td><a href="https://www.scb.se/sv_/PC-Axis/Start/"><img alt="Icono PC-Axis" title="PC-Axis" src="./img/pax.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); width:64px; height:64px; vertical-align:middle;" /></a>
</td>
<td>manual/auto</td>
<td>media</td>
<td><span class="fragment highlight-green" data-fragment-index="1">alta</span></td>
<td><span class="fragment highlight-green" data-fragment-index="1">alta</span></td>
</tr>
<tr>
<td><a href="https://sdmx.org/"><img alt="Icono SDMX" title="SDMX" src="./img/sdmx.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); width:64px; height:64px; vertical-align:middle;" /></a>
</td>
<td>auto</td>
<td><span class="fragment highlight-red" data-fragment-index="1">muy alta</span> </td>
<td><span class="fragment highlight-red" data-fragment-index="1">muy baja</span> </td>
<td><span class="fragment highlight-green" data-fragment-index="1">alta</span></td>
</tr>
<tr>
<td><a href="https://json-stat.org/"><img alt="Icono JSON" title="JSON" src="./img/json.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); width:64px; height:64px; vertical-align:middle;" /></a>
</td>
<td>auto</td>
<td><span class="fragment highlight-green" data-fragment-index="1">muy baja</span> </td>
<td><span class="fragment highlight-green" data-fragment-index="1">muy alta</span> </td>
<td><span class="fragment highlight-green" data-fragment-index="1">alta</span></td>
</tr>
<tr>
<td><a href="https://www.w3.org/TR/vocab-data-cube/"><img alt="Icono RDF" title="RDF" src="./img/rdf.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); width:64px; height:64px; vertical-align:middle;" /></a>
</td>
<td>auto</td>
<td >media</td>
<td><span class="fragment highlight-red" data-fragment-index="1">baja</span></td>
<td><span class="fragment highlight-green" data-fragment-index="1">muy alta</span></td>
</tr>
</tbody>
</table>
</section>
<section data-markdown>
<script type="text/template">
## Tipos: orientados a archivo
Los datos se almacenan en texto plano en un sistema de archivos y se sirven a través de un servidor web<!-- .element: class="fragment" data-fragment-index="1" -->
- Rápido acceso e indexado por buscadores<!-- .element: class="fragment" data-fragment-index="2" -->
- Potenciales problemas de consistencia<!-- .element: class="fragment" data-fragment-index="3" -->
- Complejidad en la conversión a otros formatos<!-- .element: class="fragment" data-fragment-index="4" -->
- Mantenimiento dependiente de personal estadístico<!-- .element: class="fragment" data-fragment-index="5" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Tipos: orientados a BD
Los datos se almacenan en un SGBDR y se sirven mediante app web<!-- .element: class="fragment" data-fragment-index="1" -->
- Aporta todas las ventajas de una BDR (ACID)<!-- .element: class="fragment" data-fragment-index="2" -->
- Facilita la conversión entre formatos<!-- .element: class="fragment" data-fragment-index="3" -->
- Requiere de una infraestructura de carga<!-- .element: class="fragment" data-fragment-index="4" -->
- Mantenimiento dependiente de personal TIC<!-- .element: class="fragment" data-fragment-index="5" -->
- La flexibilidad en cuanto a consultas suele ser baja<!-- .element: class="fragment" data-fragment-index="6" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Tipos: orientados a BI
Los datos se almacenan en un SGBDR y se sirven mediante motor OLAP<!-- .element: class="fragment" data-fragment-index="1" -->
- Caso particular del tipo anterior<!-- .element: class="fragment" data-fragment-index="2" -->
- Capa adicional de mantenimiento: cubos OLAP<!-- .element: class="fragment" data-fragment-index="3" -->
- Proporciona flexibilidad en las consultas<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Tipos: basados en herramientas
Nuevas herramientas están democratizando el BI<!-- .element: class="fragment" data-fragment-index="1" -->
- <!-- .element: class="fragment" data-fragment-index="2" -->[Tableau](https://www.tableau.com/)<!-- .element: class="fragment" data-fragment-index="2" -->
- <!-- .element: class="fragment" data-fragment-index="3" -->[Qlik View](https://www.qlik.com/)<!-- .element: class="fragment" data-fragment-index="3" -->
- <!-- .element: class="fragment" data-fragment-index="4" -->[Power BI](https://powerbi.microsoft.com/)<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-id="2b">
<h2>
OLAP y estadística
</h2>
<table style="font-size:20px">
<thead style="font-size:30px">
<tr class="headerSeparation">
<th style="font-family: 'Open Sans'; color:#ff2c2d"
>allí donde haya problemas...</th>
<th style="font-family: 'Open Sans'; color: darkblue">ponga yo solución</th>
</tr>
</thead>
<tbody>
<tr class="rowSeparation">
<td class="fragment" data-fragment-index="1"><span style="font-weight:bold;font-size:30px"
>cruces</span> indiscriminados de datos</td>
<td class="fragment" data-fragment-index="1"><span style="font-weight:bold;font-size:30px">restricciones</span> en miembros calculados</td>
</tr>
<tr class="rowSeparation">
<td class="fragment" data-fragment-index="2">integración con <span style="font-weight:bold;font-size:30px">metadatos</span></td>
<td class="fragment" data-fragment-index="2"><span style="font-weight:bold;font-size:30px">microservicio</span> proveedor de metadatos</td>
</tr>
<tr class="rowSeparation">
<td class="fragment" data-fragment-index="3"><span style="font-weight:bold;font-size:30px">rendimiento </span>/ escalabilidad</td>
<td class="fragment" data-fragment-index="3"><span style="font-weight:bold;font-size:30px">caché</span>, balanceo de carga</td>
</tr>
<tr>
<td class="fragment" data-fragment-index="4">valores no numéricos</td>
<td class="fragment" data-fragment-index="4">microservicios externos</td>
</tr>
<tr class="rowSeparation">
<td class="fragment" data-fragment-index="5"><span style="font-weight:bold;font-size:30px">secreto</span> estadístico</td>
<td class="fragment" data-fragment-index="5"><a href="http://administracionelectronica.gob.es/ctt/verPestanaGeneral.htm?idIniciativa=397#.U7MsyTREGV4">optimizador lineal y <span style="font-weight:bold;font-size:30px;">ocultación</span> de celdas</a></td>
</tr>
<tr class="rowSeparation">
<td class="fragment" data-fragment-index="6"><span style="font-weight:bold;font-size:30px">coste</span> y dependencia tecnológica</td>
<td class="fragment" data-fragment-index="6">servicio IT modesto + metodologías <span style="font-weight:bold;font-size:30px">ágiles</span></td>
</tr>
<tr class="rowSeparation">
<td class="fragment" data-fragment-index="7">poca <span style="font-weight:bold;font-size:30px">flexibilidad</span></td>
<td class="fragment" data-fragment-index="7">arquitectura <span style="font-weight:bold;font-size:30px">modular</span>: microservicios y plugins</td>
</tr>
</tbody>
</table>
<p class="fragment" data-fragment-index="7" style="font-size:20px; text-align:left; padding-top:0.8em"><a href="http://www.slideshare.net/algoya/estrategia-de-difusin-en-pcaxis">Familia PC-AXIS: Estrategia de difusión de información estadística</a>, <span style="font-weight: bold;">Alberto González Yanes</span></p>
</section>
<section data-markdown>
<script type="text/template">
## Banco de datos del ICANE
![Datos tabulares](./img/tabla900.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
## Arquitectura de difusión
![Datos tabulares](./img/archweb.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
## Componentes del banco
![Componentes](./img/data.png)
</script>
</section>
<section data-markdown>
<script type="text/template">
## API web
> Conjuntos de funciones, generalmente de uso público, que permiten a programadores y usuarios avanzados la extracción automatizada de datos de la web (entre otras funcionalidades)
[Google Maps](https://developers.google.com/maps/?hl=es-419), [Twitter](https://dev.twitter.com/rest/public)
</script>
</section>
<section data-markdown>
<script type="text/template">
### Se pueden ver como un enchufe...
![Enchufe](./img/plugin.jpg)
## de datos
</script>
</section>
<section data-markdown>
<script type="text/template">
## El ICANE dispone de tres APIs web:
- [Datos](http://www.icane.es/statistical-api)
- [Metadatos](http://www.icane.es/metadata/)
- [Datos abiertos](http://datos.icane.es/api/3/action/package_search?q=pesca)
</script>
</section>
<section data-markdown>
<script type="text/template">
## ¿Qué podemos hacer con esto?
<div class="fragment" data-fragment-index="1">[Un cuaderno...](http://nbviewer.ipython.org/gist/predicador37/94eacb48d4461cbfc98c)</div>
<div class="fragment" data-fragment-index="2">[empotrar un widget en una web...](./chart.html)</div>
<div class="fragment" data-fragment-index="3">y conectar servicios interoperables, visualizadores, etc.</div>
</script>
</section>
<section data-markdown>
<script type="text/template">
## Privacidad y secreto estadístico
Debe existir un equilibrio entre la información suministrada y los derechos o intereses de los usuarios objeto de dicha información<!-- .element: class="fragment" data-fragment-index="1" -->
**No se pueden publicar datos que permitan inferir conclusiones acerca de individuos o unidades reconocibles**<!-- .element: class="fragment" data-fragment-index="2" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Técnicas SDC
- Supresión de valores (programación lineal)<!-- .element: class="fragment" data-fragment-index="1" -->
- Rediseño de tablas (niveles de agregación)<!-- .element: class="fragment" data-fragment-index="2" -->
- CTA (Controlled Tabular Adjustment): cambiar valores "lo suficiente"<!-- .element: class="fragment" data-fragment-index="3" -->
- Microdatos: PRAM (Post-Randomization Method): con probabilidades de "desclasificación"<!-- .element: class="fragment" data-fragment-index="4" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
### ¿El futuro de los bancos de datos?
Banco de datos modular basado en microservicios<!-- .element: class="fragment" data-fragment-index="1" -->
Enfoque mixto: datasets en JSON almacenados en BD NoSQL orientada a documento<!-- .element: class="fragment" data-fragment-index="2" -->
JSON-stat + MongoDB + Javascript (Vue?) + Python?<!-- .element: class="fragment" data-fragment-index="3" -->
### ...o cambio de modelo soportado en producto<!-- .element: class="fragment" data-fragment-index="4" -->
Publicaciones sintéticas dirigidas a su consumo inmediato<!-- .element: class="fragment" data-fragment-index="5" -->
</script>
</section>
</section>
<section>
<section data-markdown>
<script type="text/template">
## Visualización
> Cualquier tipo de representación visual de información diseñada para potenciar la comunicación, el análisis, el descubrimiento y la exploración.
<small>[Alberto Cairo](http://albertocairo.com/), 20 años de experiencia en infografías, visualización de datos, periodismo de datos y diseño.</small>
</script>
</section>
<section data-markdown>
<script type="text/template">
## Ejemplo de gráfico
![La Marcha de Napoleón](./img/minard.png)
<small>[Charles Joseph Minard](https://es.wikipedia.org/wiki/Charles_Joseph_Minard); posiblemente, la mejor visualización de datos de la historia</small>
</script>
</section>
<section data-markdown>
<script type="text/template">
## Las 5 cualidades de las grandes visualizaciones
1. Veraz: basada en investigación honesta.<!-- .element: class="fragment" data-fragment-index="1" -->
2. Funcional: constituye una descripción precisa de los datos.<!-- .element: class="fragment" data-fragment-index="2" -->
3. Bella: estéticamente atractiva.<!-- .element: class="fragment" data-fragment-index="3" -->
4. Aguda: revela evidencia de otra forma difícil de ver.<!-- .element: class="fragment" data-fragment-index="4" -->
5. Esclarecedora: puede ayudar a cambiar nuestro punto de vista.<!-- .element: class="fragment" data-fragment-index="5" -->
<small>[Alberto Cairo](http://albertocairo.com/), 20 años de experiencia en infografías, visualización de datos, periodismo de datos y diseño.</small><!-- .element: class="fragment" data-fragment-index="5" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
### Elementos visuales de codificación
![Elementos de codificación](./img/encoding.png)
<small>A partir de [Cleveland y McGill](https://medium.com/@GT_Vis/evaluating-interactive-graphical-encodings-for-data-visualization-b9b8b4bf47f8)</small>
</script>
</section>
<section data-markdown>
<script type="text/template">
## ¿Cómo se hacen?
Mayormente, en Javascript<!-- .element: class="fragment" data-fragment-index="1" -->
Para que periodistas de datos cuenten historias:<!-- .element: class="fragment" data-fragment-index="2" --> [flourish](https://flourish.studio/)<!-- .element: class="fragment" data-fragment-index="2" -->
Y también con nuestros otros amigos: Power BI, Tableau, Qlik View, etc.<!-- .element: class="fragment" data-fragment-index="3" -->
</script>
</section>
<section data-markdown>
<script type="text/template">
## Cuidado con los gráficos
![Gráfico TVE](./img/tve.jpeg)
</script>
</section>
<section data-id="12a">
<h3>
Dataviz: <a href="http://www.icane.es/data/cpi-base-2011-coicop-general-group-index#timeseries">básica</a>
</h3>
<img alt="Captura chart ICANE" src="./img/googlechart.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); vertical-align:middle;" />
<p><a href="https://developers.google.com/chart/?hl=es">Google Charts</a>: simple y con <a href="./chart.html">poco código</a> </p>
</section>
<section data-id="12b">
<h3>
Dataviz: <a href="http://www.icane.es/data/municipal-register-annual-review-municipality#timeseries">mapas</a>
</h3>
<img alt="Captura mapas ICANE" src="./img/choromap.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); vertical-align:middle;" />
<p><a href="http://dmitrybaranovskiy.github.io/raphael/">Raphael.js</a>: estándar (SVG) y browser-compatible </p>
</section>
<section data-id="12c">
<h3>
Dataviz: <a href="https://developers.google.com/chart/interactive/docs/gallery/geomap">Google Geomap</a>
</h3>
<a href="http://www.icane.es/data/export-import-geographic-areas-countries#timeseries"><img alt="Captura mapamundi ICANE" src="./img/mapamundi.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0); vertical-align:middle;" /> </a>
</section>
<section data-markdown>
<script type="text/template">
## Otras
- [D3.js](https://d3js.org/)
- [chart.js](https://www.chartjs.org/)
- [Apex charts](https://apexcharts.com/)
</script>
</section>
<section data-markdown>
<script type="text/template">
## Widgets de datos
> Pequeña aplicación, programa o módulo que puede contener información visual, numérica o ambas</blockquote>
¡Las <!-- .element: class="fragment" data-fragment-index="1" -->[Fichas Municipales de Cantabria](http://www.icane.es/munreport)<!-- .element: class="fragment" data-fragment-index="1" --> están llenas de widgets!<!-- .element: class="fragment" data-fragment-index="1" -->
Aunque ya hay cosas <!-- .element: class="fragment" data-fragment-index="2" -->[mejores](https://presupuestos.cantabria.es)... ¡marchando una de presupuestos!<!-- .element: class="fragment" data-fragment-index="2" -->
<!-- .element: class="fragment" data-fragment-index="3" --> [O este panel del COVID-19](https://www.icane.es/covid19-home)<!-- .element: class="fragment" data-fragment-index="3" -->
</script>
</section>
</section>
<section>
<section data-id="1" data-markdown>
<script type="text/template">
<div class="multiCol">
<div class="col">
<div class="box">
<h2>La Web Semántica...</h2>
</div>
</div>
<div class="col">
![Portada de Scientific American 2001](./img/semantic_web.png)
</div>
</div>
</script>
</section>
<section data-id="5b">
<h2>
...o web de los datos
</h2>
<div style="text-align: center; margin-top:-0.5em">
<img alt="Web de documentos vs web de datos" src="./img/semanticweb.png" style="max-width: none; max-height: none; color: rgb(255, 153, 0);" />
</div>
<small><a href="https://www.w3.org/2001/12/semweb-fin/w3csw">W3C Semantic Web Activity</a> (<span style="font-weight: bold;">Marja-Riitta Koivunen, Eric Millers</span>)</small>
</section>
<section data-id="5c">
<h2>
<a href="http://semstats.org/">semstats</a>: ¿para qué?
</h2>
<div style="text-align: left">
<ul>
<li class="fragment" style="padding: 0 0 0.5em 0.5em">
Mejorar <span style="font-weight:bold">acceso</span> y facilitar <span style="font-weight:bold">análisis</span> de datos estadísticos
</li>
<li class="fragment" style="padding: 0 0 0.5em 0.5em">
Datos bien descritos y <span style="font-weight:bold">contextualizados</span>
</li>
<li class="fragment" style="padding: 0 0 0.5em 0.5em">
Nuevas <span style="font-weight:bold">asociaciones</span> entre conjuntos de datos
</li>
<li class="fragment" style="padding: 0 0 0.5em 0.5em">
Facilidad para habilitar <span style="font-weight:bold">procesamiento automático</span> de recursos web
</li>
</ul>
</div>
</section>
<section data-id="1" data-markdown>
<script type="text/template">
## Linked Open Data
[![Parte de la nube de LOD](./img/lod-datasets_2009-07-14_cropped.png)](https://lod-cloud.net/)
</script>
</section>
<section data-id="5i">
<h2>
Enlazado: ¿con quién?
</h2>
<table style="font-size:20px">
<thead style="font-size:30px">
<tr class="headerSeparation">
<th>Base de datos</th>
<th># enlaces</th>
</tr>
</thead>
<tbody>
<tr class="rowSeparation">
<td>Geonames</td>
<td>4</td>
</tr>
<tr class="rowSeparation">
<td>DBpedia</td>
<td>45</td>
</tr>
<tr class="rowSeparation">
<td>DBpedia española</td>
<td>47</td>
</tr>
<tr class="rowSeparation">
<td>INE</td>
<td>251 (no RDF)</td>
</tr>