A busca em livros da Google, os títulos órfãos e a privacidade da leitura
Por Ruy José Guerra Barretto de Queiroz
Iniciado em 2004, o projeto da Google de digitalização e indexação de livros e criação de uma biblioteca universal digital, conhecido como “Google Book Search”, já conta com mais de 7 milhões de obras no seu acervo, e o objetivo é chegar a algo em torno dos 15 milhões de livros. Para viabilizar e operacinalizar o projeto, a gigante da busca na internet fez um acordo com algumas bibliotecas de universidades americanas que a permite digitalizar seus respectivos acervos, e em contrapartida a biblioteca recebe uma cópia digital de seu próprio acervo.
Ao digitalizar um livro, a Google disponibiliza seu conteúdo ao cidadão da rede, que poderá baixá-lo em toda a sua totalidade se a obra já estiver no domínio público (atualmente são cerca de 1 milhão), mas somente trechos (em inglês, “snippets”) de partes relevantes do livro que ainda esteja protegido por direitos autorais, a menos que o detentor de tais direitos tenha concordado em permitir uma maior disponibilização.
Conforme descreve Pamela Samuelson (“Richard M. Sherman Distinguished Professor of Law and Information” na Universidade da Califórnia, Berkeley, assim como Diretora do Berkeley Center for Law & Technology) em um artigo reproduzido em vários portais, incluindo o O’Reilly Radar (“Legally Speaking: The Dead Souls of the Google Booksearch Settlement”, 17/04/09), no outono de 2005, o “The Authors Guild, Inc.” (associação de escritores sediada nos EUA que à época tinha cerca de 8000 membros) entrou com um processo contra a Google por violação de direitos autorais. (À mesma época, porém em separado, cinco editoras moveram ação semelhante contra a Google.)
Em sua defesa, a Google contestou a representatividade do Authors Guild, e argumentou que o trabalho de digitalização, indexação e disponibilização de trechos das obras se caracterizava como uso razoável e não-infrator porque promovia acesso público mais amplo aos livros e porque a Google havia se comprometido a remover do corpus quaisquer obras cujos detentores dos direitos autorais se manifestassem contra a sua inclusão. Muitos profissionais dos direitos autorais esperavam que o caso “Authors Guild versus Google” viesse a se tornar o caso mais importante de “uso razoável” (em inglês, “fair use”) do século XXI.
Em 28/10/08 a Google anunciou um acordo com autores e editoras nos processos coletivos que daria o sinal verde à empresa para a continuação do ambicioso projeto. Autores e editoras teriam que concordar com os termos do Acordo até o prazo final estabelecido pela Justiça americana. Com prazo final de fechamento do Acordo originalmente marcado para 05/05/09, em 28/04/09 foi anunciado que o juiz federal Denny Chin concedeu aos autores mais quatro meses para decidir se participam ou não do Acordo. O último prazo passa a ser 04/09/09.
Nesse ponto surge a questão de como a Google poderia estar obtendo uma licença para tornar disponíveis online milhões de livros ainda protegidos por direitos autorais simplesmente chegando a um acordo com uma pequena fração de autores e editoras? Samuelson explica que a lei nos EUA permite a submissão de processos judiciais do tipo “ação de classe” (em inglês, “class action”) nos quais os reclamantes reivindicam que representam uma classe de pessoas que sofreram o mesmo tipo de danos pela ação errônea do reclamado, desde que existam questões em comum de fato e de direito de modo que torna-se desejável adjudicar as queixas num único processo ao invés de muitos.
O fato é que o “Authors Guild” e alguns de seus membros moveram uma ação contra a Google, reivindicando representar uma classe de autores similarmente situados cujos livros a Google estava digitalizando, e cujos direitos autorais a Google estava infringindo. Ao entrar com uma “ação de classe”, o Authors Guild pôs considerável pressão financeira sobre a Google pois quem ganha uma ação de classe tem direito a uma compensação que equivale a tudo que é devido à classe, que pode ser exponencialmente mais alta que indenizações a reclamantes individuais.
O Acordo prevê que a Google: (i) pague aos autores e às editoras US$125 milhões, parte dos quais será usada para criar um “Book Rights Registry” (uma espécie de entidade controladora da arrecadação dos direitos autorais), permitindo aos detentores dos direitos autorais registrar suas obras e receber uma parcela das assinaturas, vendas de livros e receitas de propaganda; (ii) permita aos usuários comprar livros em sua totalidade, e gravá-los uma “prateleira eletrônica”; (iii) oferecerá assinaturas institucionais, incluindo um portal online gratuito para bibliotecas públicas; (iv) direcionará os usuários a localizações onde comprar ou tomar emprestado o livro pesquisado.
O Acordo também diz que os autores e as editoras serão capazes de ativar modos de “visualizar” e “comprar” para livros que estejam ainda em catálogo e protegidos por direitos autorais, assim como monetizar livros fora de catálogo (i.e., esgotados) que forem digitalizados pela Google. Estima-se que 70% dos livros no repositório do projeto da Google ainda estão protegidos por direitos autorais, mas estão esgotados. A maioria deles, na prática, estão “órfãos”: tudo indica que é praticamente impossível localizar os detentores dos direitos para lhes solicitar permissão para digitalizá-los.
Parece haver um consenso em torno do benefício trazido pela digitalização dessas obras órfãs, mas, obviamente, sem a devida proteção legal qualquer projeto de digitalização estaria correndo risco de processo contra violação de direitos autorais. O Congresso americano está inclusive considerando a introdução de leis que diminuam os riscos de se utilizar obras órfãs sem a permissão dos detentores dos direitos autorais. O Acordo concede à Google, entre outras coisas, uma licença para exibir até 20% do conteúdo de livros esgotados mas ainda sob proteção, inserir anúncios ao lado dessas imagens digitalizadas, e vender acesso aos textos integrais desses livros a assinantes institucionais e indivíduos.
Logo após ser anunciado, começaram a aparecer as manifestações de oposição ao Acordo, incluindo a do Departamento de Justiça e a da organização para defesa do consumidor “Consumer Watchdog”. Talvez uma das mais significativas tenha vindo do “The Internet Archive”, uma organização sem fins lucrativos fundada por Brewster Kahle (o mesmo que fundou a “Open Content Alliance”) dedicada à construção e à manutenção de uma biblioteca digital online livre e “abertamente acessível”, incluindo um repositório da Web. Baseado em San Francisco, Califórnia, o repositório inclui “imagens da World Wide Web” (i.e., cópias de páginas tiradas em vários pontos no tempo), software, filmes, livros, e gravações em áudio. Para garantir a estabilidade e a durabilidade do repositório, sua coleção mantém um espelho (i.e., cópia) na Bibliotheca Alexandrina do Egipto, até agora a única biblioteca no mundo com um espelho. (Em 2001 o “The Internet Archive” fez uma doação à Bibliotheca Alexandrina da ordem de US$ 5 milhões, que incluiu, além de cerca de 10 bilhões de páginas web do período 1996-2001, um laboratório de digitalização de livros.)
Em carta ao Juiz Federal Denny Chin que está à frente do processo o representante legal do “The Internet Archive” solicita intervenção no caso argumentando que o Acordo dá à Google (e somente a ela) imunidade contra a responsabilização por infringir direitos autorais através da digitalização e disponibilização de títulos órfãos. Sem imunidade semelhante, “o Archive seria incapaz de prover alguns dos mesmos serviços devido a algumas questões legais incertas em torno de títulos órfãos.”
Numa palestra intitulada “Reflections on the Google Book Search Settlement”, proferida em 14/04/09 na Universidade da Carolina do Norte, Samuelson examina diversas questões fundamentais que têm sido levantadas por diversos profissionais e entidades envolvidas ou interessadas no caso: Por que a Google foi processada e até que ponto sua defesa de uso razoável foi boa? O que motivou o Acordo sobre os processos? Que benefícios o Acordo deverá trazer? Quais são os riscos, as desvantagens ou problemas com o Acordo? Que mais poderia acontecer para que se “resolva” os problemas que o Acordo tem?
Entre as motivações para o Acordo, Samuelson cita o fato de que além do litígio ser custoso e possivelmente demorado, seria difícil prever o resultado devido à dificuldade inerente ao chamado “uso razoável”. Também, se por um lado a Google corria riscos quanto aos danos à imagem, juntamente com a possibilidade de longa disputa e perda da licença sobre obras órfãs, por outro lado nenhuma outra entidade está, no momento, mais capacitada não apenas para levar o projeto a bom termo mas também para criar novos mercados para livros no mundo digital inclusive para os títulos esgotados. O Acordo parece ter criado uma oportunidade para uma situação do tipo “ganha-ganha” tendo em vista a disposição da Google de compartilhar as receitas com o Authors Guild.
De modo geral, há que se reconhecer entre os benefícios do Acordo não apenas a remoção de cima das cabeças da Google e bibliotecas parceiras da nuvem negra da responsabilização por infração, mas sobretudo a disponibilização pública de mais livros do que se a Google não encampasse o projeto ou mesmo se restringisse a livros no domínio público. Nem tudo são flores, e há pontos negativos no Acordo. Primeiramente, os críticos não se conformam com a concessão do que pode significar direitos exclusivos sobre títulos órfãos. Também, além de estar possivelmente inviabilizando outros projetos de digitalização, o Acordo cria 2 “monopólios” complementares, segundo Samuelson: Google Book Search e o Book Rights Registry podem estar assumindo o controle de estabelecer preços e outros termos de acesso aos títulos digitalizados.
Mais preocupante entre todos os problemas do Acordo está a ausência de garantias sobre a privacidade do leitor dos livros digitalizados. A “Electronic Frontier Foundation”, uma organização sem fins lucrativos dedicada à defesa dos direitos civis na internet, declarou recentemente que planeja solicitar à justiça americana garantias de que a Google não irá monitorar os hábitos de leitura dos usuários do serviço de Book Search.
Adicionalmente, em documento submetido em 04/05/09 ao Juiz Chin, três grupos representando bibliotecas, a American Library Association, a Association of College and Research Libraries (ACRL) e a Association of Research Libraries (ARL), identificados como “The Library Associations”, embora declarando que não se opõem ao Acordo, solicitaram especial atenção da corte de modo a garantir que a privacidade dos leitores de livros disponibilizados online pela Google seja minimamente protegida. Segundo o documento, “a privacidade é um dos valores mais fundamentais das bibliotecas; bibliotecas não monitoram os hábitos de leitura de seus usuários.”
Com efeito, todos os 48 estados americanos e o Distrito de Columbia têm normas que protegem os registros de bibliotecas contra intrusão indevida em prejuízo da privacidade, requerendo em geral uma intimação antes que uma biblioteca mantida com verbas públicas possa revelar os registros com informações pessoais identificáveis. Ao invés disso, o Acordo não especifica como a Google e o Book Rights Registry vão proteger a privacidade do usuário. Visto que a Google fornecerá aos consumidores que comprarem um livro o acesso online perpétuo ao título, ela tem que guardar os registros para garantir que o acesso do consumidor persiste no tempo, particularmente à medida que o consumidor usa computadores diferentes para acessar o livro. Mas o Acordo é omisso no que concerne a que tipo de informação a Google deverá reter relativa ao consumidor, como usará essa informação, e que medidas tomará para proteger a segurança da informação.
O Acordo também contém poucos detalhes sobre as informações do usuário no contexto da assinatura institucional: como apenas usuários autorizados poderão acessar o repositório, a Google deverá ter elementos para determinar qual usuário está acessando qual livro no repositório. Além disso, o Acordo diz que quando um usuário imprime páginas de um livro, a Google vai incluir uma marca d’água visível com informações identificadoras criptografadas da sessão, que poderia ser utilizada para identificar o usuário autorizado que imprimiu o material ou o ponto de acesso a partir do qual o material foi impresso. Não fica claro no Acordo quais dessas informações serão retidas pela Google, nem como serão usadas, tampouco que medidas serão tomadas para protegê-las.
Conforme o documento da The Library Associations, o silêncio do Acordo quanto à preservação da privacidade da leitura está em franco contraste com seus detalhes com respeito às medidas que as bibliotecas parceiras do projeto devem levar em conta para proteger a segurança de suas cópias digitais dos títulos. São dezessete páginas de descrição detalhada de protocolos e requisitos a serem atendidos por quaisquer bibliotecas que desejem participar do Acordo. Está inclusive previsto um plano de socorro monetário de até US$5 milhões à entidade que venha a sofrer algum tipo de invasão ou ato de vandalismo, dependendo dos danos causados, mas não há uma preocupação explícita com a proteção da privacidade do usuário.
A se confirmar o cenário de monopólio da Google, é preciso haver normas explícitas que venham a oferecer um mínimo de salvaguardas para que a privacidade de leitura seja garantida.
PS: Ruy é professor associado do Centro de Informática da UFPE e escreve para o Blog às segundas.
Blog de Jamildo, (Jornal do Commercio Online, Recife), 11/05/2009, 09:04hs,
Um comentário:
Oi Ruy,
Muito bom o artigo e bastante elaborado.
São muitas as questões envolvidas...
O que está motivando toda esta discussão é a pirataria. Como é que sites como o gigapedia.com, avaxhome.org continuam no ar? São milhares de livros...
Uma diferença importante entre livro e música é que os artistas (vivos) podem ganhar com shows. E os escritores? Com cursos e palestras? Nem todo mundo tem essa disponibilidade. Se não houver uma forma de recompensar quem escreve livros, a produção de livros de qualidade tende a diminuir.
Postar um comentário