Aiuto:Come individuare possibili violazioni di copyright


Questa è una guida per individuare violazioni della politica di Wikipedia sul copyright consistenti in "copia e incolla" da altri siti web.

Indizi di contributi che potrebbero essere frutto di "copia e incolla" cange

Ci sono diversi indizi che indicano che un contributo possa essere stato immesso nell'enciclopedia tramite una operazione di "copia e incolla". Nessuno di questi rappresenta una prova conclusiva, ma più di uno di questi indizi spesso tende a capitare.

Segnali di allarme, ma forse il contributo è innocente:

  • tipicamente non sono wikificati
  • o se lo sono, sono linkati eccessivamente, con ogni occorrenza di una parola o frase convertita in un wikilink (come se fosse stato usato il "trova e sostituisci" per inserire i collegamenti)
  • vengono solitamente inserite in un colpo solo in forma completa, invece che crescere per gradi con più utenti che contribuiscono
  • mancano anche di modifiche minori, come le correzioni di errori di battitura.
  • lo stile in cui sono scritti è "troppo buono per essere vero"

Segni fortemente indicativi di "copia e incolla":

  • Codice HTML che non è valido o non è comunemente usato in Wikipedia, come i tag "HEAD", "BODY", "TITLE" e "HTML". Ciò suggerisce un tentativo di "copia e incolla" dal sorgente di una pagina HTML, invece che dalla pagina visualizzata.
  • frasi rivelatrici tipo "questo opuscolo"
  • potrebbero esserci anche parole o frasi isolate o fuori contesto, come "top", "vai all'inizio", "pagina successiva", "clicca qui", che erano in origine parte della struttura di navigazione del sito web di origine
  • potrebbero contenere caratteri fuori standard come le Microsoft smart quote (ma potrebbero essere state composte con Microsoft Word o con qualcosa di simile)
  • spesso contengono caratteri di copyright (™,®) e simili, segni tipici di testi commerciali
  • ASCII art che non appare correttamente quando viene copiata (ma potrebbe trattarsi di un novizio che non conosce ancora la formattazione wiki)
  • lo stile di scrittura è quello dei messaggi pubblicitari o delle agenzie stampa
  • l'utente che ha inserito il contributo ha fatto di recente altre sospette violazioni di copyright

Strada senza (altra) uscita:

  • Alcune pagine copiate contengono addirittura l'avviso di copyright del sito originale. Copiato intatto! In questo caso, potete supporre che siano quasi certamente violazioni di copyright, a meno che il contributore sia in effetti il detentore dei diritti, in questo caso l'onere della prova è a carico del contributore, che deve dimostrare di essere tale persona (o di avere titolo a cedere diritti non originariamente suoi).

Verifica sui motori di ricerca cange

Quando uno o più di questi segnali vi mettono in allarme, copiate una frase del testo e cercatela in un motore di ricerca come:

Scegliete una frase che ritenete difficilmente possa essere stata modificata: alcuni, infatti, prevedendo questo tipo di controllo, alterano alcuni punti di ciascuna frase, pensando di ostacolare il riconoscimento del plagio. Attenzione: piccole modifiche e o cambio nell' ordine di scrittura dei paragrafi non fanno venir meno la violazione del copyright, perciò se le differenze fra i testi sono limitate a qualche singola parola, agli articoli, alla punteggiatura, la violazione sussiste ancora.

Quando i risultati sono tanti, provate a restringere la ricerca mettendo fra virgolette ("") il testo cercato: il motore di ricerca si limiterà a segnalare solo i casi in cui la stringa di ricerca si presenta così com'è stata immessa, nella stessa sequenza di parole. Se non si ottengono in questo modo dei risultati, potrebbe essere il caso di modificare la stringa di ricerca, ad esempio riducendone la lunghezza, o dividendola in più parti.

Gli utilizzatori del browser web Firefox possono trovare utili alcune estensioni che consentono di accelerare la ricerca su Google partendo dalla semplice selezione del testo.

Tenete presente che a volte i testi sono prelevati da documenti in formati non-HTML, ad esempio file dei tipi .pdf, .rtf, .doc, .xls (ed altri); per la maggior parte di essi Google consente la lettura diretta di questi documenti in HTML cliccando su "cached" (funzione che peraltro evidenzia con il colore le parole cercate), ma a volte occorrerà aprire il file nel formato originale (dopo il controllo antivirus :). Se il risultato è positivo, se cioè avete trovato da dove è stato copiato il testo in esame, copiate per la segnalazione l'indirizzo web del documento, non l'indirizzo della pagina cache di Google.

Tenete inoltre presente che se sul sito dove trovate il testo non vi sono indicazioni di diritti, si deve presumere che il testo sia coperto da diritti d'autore; la mancanza del simbolo ©, l'assenza di diciture di copyright, non sono infatti assolutamente indizio di rinuncia ai diritti da parte del legittimo titolare (il diritto di autore pende comunque anche in assenza di precisazione). L'unico caso in cui sia consentito acquisire quel testo in Wikipedia è quando espressamente leggete che il testo è rilasciato in pubblico dominio, oppure con licenza GFDL, oppure nelle categorie ammissibili di Creative Commons. Usate il buon senso per chiedervi ciascuna volta se chi rilascia quel testo con diritti di nostro interesse ne sia davvero il titolare (in genere lo è, ma non sempre; comunque, non allestite un'investigazione, ma cercate di capire l'attendibilità delle indicazioni offerte dal proprietario del sito o dal webmaster).

Per maggiore accuratezza, ripetete la ricerca anche nei newsgroups (Usenet).

Quando si tratta di immagini, tenete presente che a volte chi carica su Wikipedia un'immagine "prelevata" da altri siti lo fa senza cambiarne il nome, rendendo facilmente individuabile la violazione impiegando la sezioni di ricerca immagini dei motori di ricerca, con l'inserimento del nome del file (ad esempio, se l'immagine si chiama "Image:Esempio.jpg", inserite "Esempio.jpg", senza virgolette, nella casella di ricerca. Se l'immagine è stata invece caricata con un nome diverso, strumenti del genere si rivela ugualmente spesso utili, cercando per parole chiave secondo l'argomento dell'immagine.

Se si scopre una violazione cange

Se si ha evidenza di identità fra il testo (o una immagine) presente in una voce di Wikipedia e l'equivalente trovato in rete, non occorre chiamare ogni volta la polizia per chiederle di indagare sull'accaduto. La questione di più diretta urgenza è l'interruzione della situazione di irregolarità sulle nostre pagine.

L'elemento più importante è l'indirizzo (URL) della pagina web o dell'immagine di cui abbiamo scoperto la "clonazione", oppure ogni e ciascun dato utile a consentire il rintracciamento della fonte originaria. Abbiamo wikipediani specializzati nell'analisi e nella soluzione di situazioni di questo genere, perciò, se non vuoi procedere da solo o temi di commettere qualche imprecisione, rivolgiti tranquillamente a loro utilizzando le pagine di servizio dedicate, cercando di fornire con precisione tutti gli elementi che hai ricavato dalla tua verifica.

Piccole cose da tenere a mente cange

  • Non mordete i nuovi arrivati: molti fra quelli che hanno pensato di contribuire a Wikipedia con un veloce "copia-incolla", non sono ben consapevoli di aver commesso una irregolarità di tipo assai grave. Si tratta spesso di utenti appena arrivati, con poca pratica delle leggi in materia di copyright (che sono comunque difficili da trovare, da leggere e da interpretare per la persona comune) e poca pratica del nostro progetto. Fra questi, ci è capitato di scoprire, alcuni erano anche appassionati e dottissimi studiosi (non di diritto, però...). Nulla di tutto questo allevia la gravità della violazione di copyright, ma non dobbiamo presumere di primo acchito che il gesto sia indice di volontario danneggiamento. Chiedete quindi subito chiarimenti all'autore dei contributi nella sua pagina di discussione, se si tratta di un utente registrato. Se l'autore è in buona fede (cosa che accade più spesso di quanto si pensi), spiegargli come contribuire sarà senz'altro più utile che perseguirlo.
  • A volte incorrerete in falsi allarmi: se ad esempio il contributore è proprio l'autore di quel testo o di quella immagine, potreste trovare quel testo o quella immagine anche altrove, magari con una licenza di tipo diverso. Nulla vieta infatti che l'autore (caso tipico) gestisca un suo sito personale con riserva di diritti (e col simbolino ©) e decida contemporaneamente di cedere a Wikipedia i suoi lavori con la licenza che ci occorre, la GFDL (in questo caso deve darci un permesso via e-mail, ma la presenza del suo testo altrove non ci riguarda). Un altro caso non raro è quello in cui si trova materiale apparentemente rilasciato con licenze incompatibili con Wikipedia, ma in realtà nato e creato con licenze originarie libere, ad esempio in pubblico dominio: si tratta in molti casi di abusi, oppure di imprecise attribuzioni di diritti (ad esempio i diritti pendono sulla grafica e sull'impaginazione del sito, ma non sul testo). Verificate sempre con attenzione. Se vi rendete conto di avere a che fare con un falso allarme, lasciate al più presto una nota ben evidente nella pagina di discussione della voce.

Voci correlate cange