Exportem dades des de Drupal 6 a un repositori central CSV i importem en les noves taules

Exportem dades des de Drupal 6 a un repositori central CSV i importem en les noves taules

La idea és clara: faig consultes MySQL amb la informació que vull exportar, em cree un fitxer CSV i més tard importe eixa informació a la nova base de dades personalitzada.

Amb la següent consulta SQL aconseguisc tota la informació de la base de dades Drupal 6 de Klaku.net relativa a les notícies (codi id, títol, autor, categoria, url_font_noticia, vots_positius, vots_negatius i descripció).

I ja podem preparar fitxers CSV per a totes les taules o funcionalitats de la nova base de dates que estiguem dissenyant.


SELECT node.vid, node.created, users.uid, node.title, content_type_story.field_url_url,
Sum(Case When value > 0 then value end) totalPositius,
Sum(Case When value content_type_story.field_priskribo_value, term_data.name AS categoria
FROM content_type_story, users, node, term_data, term_node, votingapi_vote WHERE node.type="story" AND

term_node.nid=node.nid AND term_node.tid=term_data.tid
AND node.uid=users.uid AND content_type_story.nid=node.nid AND votingapi_vote.content_id=node.vid GROUP BY node.vid ORDER BY node.vid;

Generem també un fitxer CSV amb el resultat de la taula de les categories o seccions final que obtenim amb la següent ordre:


SELECT tid, vid, name FROM term_data;

Generem també un CSV amb tots els comentaris de les notícies de la web:


SELECT cid, nid, uid, comment FROM comments;

I també un CSV amb la taula final dels usuaris (de moment, pròximament canviarem la manera d'identificar-nos a Klaku.net) amb la següent consulta SQL:


select uid, created, name, mail, pass, picture from users

Prèvia neteja de la base de dades

Cal dir que a Drupal 6, també hi havien molts (molts) usuaris spammers i notícies i comentaris d'aquestos. Cal fer neteja, anar identificant els spammers i esborrar tant els usuaris com tots els continguts que hagen pogut generar y que ni honeypot, ni captcha ni recaptcha hagen pogut evitar.

Concretament, vaig apuntar el nom i ID dels spammers, i no eren pocs:


princehunterz1 8589
mejeng 8511
yaangcom 7950
mesotek 7686
Pipe Fit 7376
dhruvil007 7444
MenatapKedep 8582
ASTEC INC. 8618
dennyfar 8628
adas84004 7892
packersmovershd 8608
david86 8524
hrsoftware41 8576
markhilton057 8306
jainuniversity 8276
labdhieng 7326
siddhagiri 7442
victorsteels 7448
rajendraftings 7450
ekhard 7451
amardeepsteel 7452
piyushsteel 7453
nandishwarsteel 7454
simplexfitings 7455
kalping 7456
rfpindia1 7458
rajendraflanges 7460
dhruvil123j 7445
ggssheets 7461
steelforged 7464
Rajendra Mehta 7465
Mukesh Doshi 7470
jasaseoku 8241
MenatapKedep 8582
astecinc 8617
packersMoversDelhi 8654
daewrer 8418
aabisoft 8461
jessicaamirr 8484
JasonBryant 8234
hap53144 8411
rajesh33444 8331
Aplonis 7411
Academics Projects 8273
ipmetix 8270
marketersid 7878
jainsteels 7440
jafanseh 7443
suryafifings 7459
kalikundsteel 7462
sanghvi 7474
CoxEddy 7472
inventorydeal 7813
digitalvision 7815
moverspackeronline 7848
smithsm1221 7525
Academics Projects 8274
esignature21 8574
discountgyan 8559
sutiexpense 8547
Pacckersmoversbangalore 8647
PackersMoversChennai 8668
bartosz85 7343
Odom 7353
pavankumarsites 8659
expensemanage21 8575
esignatures31 8551
UnksadUa 8512
flexoteproduct 8496
weinerjones 8442
Aachol 8284
manishlpd 8200
kalikundsteel 7462
Tjeri 7651
klanet 7816
ashtapadoversas 7675
poezhang 7828
bloggingsocity1 7875
Joey chen 7895 manishlpd 8200
regxo 8322
drclintcornelpac 7434
oswin overseas 7433
abouadil 7429
dazy saloman 8400
Joey chen 7895
jenniferjoseph 7402
aike 7409
siersen4554 7407
007jamesbond 7405
kalikundsteels 7463

- Esborrem els nodes amb usuaris spammers amb DELETE from node where uid="$n";

- Esborrem els usuaris spammers amb DELETE from users WHERE uid="$n";

- Esborrem els comentaris dels spammers amb DELETE FROM comments WHERE uid="$n";