-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathBEIC_ape_mapdata.py
96 lines (87 loc) · 2.76 KB
/
BEIC_ape_mapdata.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Script to convert the TSV of BEIC (APE) publishers into a JSON for the web map
with coordinates guessed by querying the Google Maps API.
"""
#
# (C) Federico Leva e Fondazione BEIC, 2016
#
# Distributed under the terms of the MIT license.
#
__version__ = '0.1.0'
#
from geopy.geocoders import GoogleV3
import json
import unicodecsv as csv
import requests
from collections import namedtuple
import re
import sys
def getCoordinates(keyword=None):
return
with open('EditoriPerNavigatore.csv', 'r') as csvfile:
publishers = csv.reader(csvfile,
delimiter='\t',
lineterminator='\n',
quoting=csv.QUOTE_MINIMAL,
encoding='utf-8')
header = next(publishers)
print("Header of the input table: %s" % ', '.join(header) )
data = namedtuple('data', ', '.join(header))
data = [data._make(row) for row in publishers]
mapdata = []
for row in data:
editore = row.Editore
anno = row.AnnoInizialeDiPubblicazione
produzione = row.Documenti
if not produzione:
produzione = 0
print "Current row: %s %s" % (anno, editore)
pos = None
for i in range(0, len(mapdata)-1):
if mapdata[i]['name'] == editore:
pos = i
break
if not pos:
indirizzo = "%s, %s, %s" % (row.Indirizzo, row.CAP, row.Comune)
via = "%s, %s, %s" % (re.sub('[0-9,]+', '', row.Indirizzo), row.CAP, row.Comune)
# La presenza della provincia non è garantita ma è richiesta a pena di errori PHP
if row.SiglaProvincia:
provincia = row.SiglaProvincia
else:
provincia = "MI"
# L'URL intero verrebbe reso con un errato "http//"
collegamento = re.sub('https?://', '', row.Collegamento)
geolocator = GoogleV3(api_key="xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx")
# geopy.geocoders.Nominatim(user_agent="BEIC-APE-0.1", country_bias="Italy", timeout=5)
# geolocator = Mapzen(api_key="mapzen-zzzzzzz", user_agent="BEIC-APE-0.1", country_bias="Italy", timeout=1)
try:
location = geolocator.geocode(indirizzo)
if not location:
location = geolocator.geocode(via)
except:
print "Could not find: %s" % indirizzo
if location and location.longitude and location.latitude:
lo = location.longitude
la = location.latitude
else:
# Centro di Milano. L'importazione altrimenti mette gli editori all'equatore.
lo = 9.2
la = 45.4
mapdata.append( {
"produzione": [],
"cap": row.CAP,
"provincia": provincia,
"catalogo": collegamento,
"sito": row.SitoWeb,
"citta": row.Comune,
"name": row.Editore,
"indirizzo": row.Indirizzo,
"longitude": lo,
"latitude": la
} )
pos = len(mapdata)-1
mapdata[pos]['produzione'].append( { "anno": anno, "produzione": produzione } )
with open('EditoriPerNavigatore.json', 'w') as out:
json.dump(mapdata, out, indent=1)