Codemountain, Paulo Suzart's Blog

Blog sendo desativado

leave a comment »

Para o que vem seguindo o blog e tem notado que não posto por aqui, visite meu blog definitivo: http://paulosuzart.github.com/. Desde o início do ano decidi mudar para o github e postar apenas em inglês.

Este blog ficará no ar pois ainda recebe muitos visitantes. Agradeço aos leitores e os aguardos no novo blog.

 

Abraços!

 

Paulo Suzart. @paulosuzart

Written by paulosuzart

março 28, 2012 at 12:45 am

Publicado em Uncategorized

Twitter Finagle, primeiras impressões

leave a comment »

Quanto tempo sem postar sobre Scala! Mas isso não significa que fiquei sem estudar a linguagem e muito do que gira ao seu redor. Neste Post, vou colocar alguma scoisas sobre o Twitter Finagle, auto entitulado como uma biblioteca para construção de servidores e clientes RPC assíncronos em Java, Scala ou qualquer coisa que execute na JVM.

O finagle é uma camada muuuuuito fina em cima do JBoss Netty, que é um framework Java NIO realmente surpreendente e sabidamente veloz. O Netty é a base para o Aleph (clojure), framework que postei outro dia.

Aqui vai um hello world tosco com o Finagle:

class SimpleService extends Service[HttpRequest, HttpResponse] {
  def apply(request: HttpRequest): Future[HttpResponse] = {
    val response = new DefaultHttpResponse(HTTP_1_1, Ok)
    Future.value(response)
  }
}

A coisa é simples. Service é uma classe do finagle que extende uma função que recebe um HttpRequest do netty e retorna um Future[HttpResponse]. Future é uma estrutura para programação assíncrona fantástica, mas talvez seja assunto para outro post. No exemplo acima, a única coisa que o servidor faz é responder um 200 para o cliente.

E sim, se eu quiser saber os parâmetros de uma query string ou mesmo de um formulário submetido, teria que fazer tudo isso manualmente. Para isso o finagle traz uma pequena abstração em cima do HttpRequest do Netty, é o Request. Nela é possível encontrar funções mais civilizadas e algumas outras facilidades como gerar o response a partir da requisição, aproveitando então seu encoding, versão http, etc. Uma versão mais interessante usando algumas classes providas no finagle é a seguinte:

class AdvancedService extends Service[Request, Response] {
  def apply(request: Request): Future[Response] = {
    (Path(request.path)) match {
      case Root / "user" / Integer(id) =>
        val response = request.response
        response.setContentString("The user id is %d\n\n" format id)
        Future.value(response)
    }
  }
}

Aqui aparecem algumas coisas interessantes. A classe Path permite extrair os conhecidos Path Parameters em um pattern match, que no caso pega o caminho imediatamente após /user. Se requisitarmos /user/21, a resposta do servidor apresentará o identificador repreentado no path. O pacote http.path do finagle possui outras facilidades para parâmetros em query string e métodos Http. Acabei usando em um pequeno trabalho pessoal para facilitar as coisas.

Mas espera! Tem muito código aqui. Então por que não reduzir essa coisa toda? Eu queria chegar ao ponto de apenas entregar uma função parcialmente aplicada que fizesse um match na requisição para saber seu HTTP VERB. Se for o que desejo tratar, então faço um pattern mach nos seus parâmetros para seguir com o processamento. Pode ficar assim:


val superAd = ~~ {
  case (Get, request) =>
    (Path(request.path)) match {
       case Root / "user" / Integer(id) =>
            val response = request.response
            response.setContentString("The user id is %d\n\n" format id)
            Future.value(response)
    }
}

Wow! Bem melhor.E fiz isso com uma minuscula abstração que é a seguinte:

  val methNotAllwd: PartialFunction[(HttpMethod, Request), Future[Response]] = {
    case (_, request) =>
      val response = request.response
      response.status = MethodNotAllowed
      Future.value(response)
  }

  def ~~(body: PartialFunction[(HttpMethod, Request), Future[Response]]) = {
    new Service[Request, Response] {
      def apply(request: Request): Future[Response] = {

        val pf: PartialFunction[(HttpMethod, Request), Future[Response]] = {
          body orElse methNotAllwd
        }
        pf(request.method, request)
      }
    }

  }

Além de poder usar a função ~~ para tratar minhas requisições, caso o método da requisição não tenha um pattern definido, será retornado um 405 para o cliente. Prefiro abstrações pequenas à mega abstrações que custumávamos fazer há uns 8 anos atrás. Tinhamos quase que um framework caseiro em cima de qualquer outro framework que usávamos.

Para executar um servidor http com o superAd atendendo as requisições, use o codec RitchHttp ao invés do Http puro.

Aqui falei muito rapidamente da parte Http para o lado servidor do Finagle, mas existe uma gama de features muito legais. Uma delas é a possibilidade de encadear filtros na requisição, semelhante aos filtros Servlet. No código de exemplo deste post, você pode ver que usei o ExceptionFilter que já vem no finagle. Ele vai tratar qualquer exceção no seu código.

Como estou usando o Finagle?

Bem, construí um proxy SQS para um projeto de um amigo. Ele precisa receber mensagens mas não pode tornar as suas filas públicas. Além disso, é preciso validar a mensagem e autenticar o usuário antes de permitir que a mensagem vá para a fila.

Por que o Finagle?

Eu realmente acredito que precisamos reaproveitar coisas boas. O finagle oferece uma camada fina sobre o netty, e por isto não precisamos de um container WEB ou Servido de aplicação JEE, etc. Todo o seu código vai rodar com o mínimo de camadas e num nível baixo de abstração, o que tende a ser mais performático. Além de tornar o netty com uma cara de Scala.

Outro ponto importante é que a construção de clients é tão simples quanto a criação de services. Além de poder em alguns casos usar outros protocolos (Thrift, TCP puro com codecs) e manter a mesma simplicidade.

O finagle – e quase todos os projetos open source do Twitter – pode fazer sua vida ficar mais fácil. Outro projeto que uso neste mesmo caso é Logging. Simples, direto e com cara de Scala.

O código do post pode ser baixado aqui no meu github.

Written by paulosuzart

outubro 14, 2011 at 5:04 pm

Publicado em scala

Tagged with ,

Flowchart de apoio a escolha de tipos em Clojure

with 4 comments

Muitas vezes fiquei em dúvida sobre qual forma de definição de tipos em Clojure utilizar. As opçõe são muitas: deftype, defrecord, reify, proxy, e gen-class e é fundamental um bom entendimento de cada uma delas para fazer a melhor escolha sua implementação.

Foi aí que encontrei este post de Chas Emerick, um dos autores de Clojure Programming: Rough Cuts Version. Este livro promete muito e não vejo a hora de tê-lo em mãos.

No post, Chas fala a respeito da tarefa de escolher o tipo certo e mostra um fluxo que ajuda e muito, não só entender os tipos, mas como fazer a melhor escolha. Depois de OGINO Masanori oferecer uma versão em Japonês, me ofereci para fazer uma tradução para português, e Chas aceitou. Assim você pode usar como Wall paper ou fazer impressão bem grande para deixar na parede mais próxima. Clique na imagem para ampliar.

Usando as próprias palavras do autor, a Zona de Interoperabilidade (ou “The ‘Interop Zone'”) do chart, agrega os seguintes casos:

“The ‘Interop Zone’” demarcates use cases (e.g. needing to define multiple constructors) and forms (proxy and gen-class) that are exclusively the domain of Clojure’s JVM interoperability support. Using these forms is fine, but be aware that by doing so, you are stepping outside of Clojure’s “native” abstractions; unless you are defining a type for the express purpose of meeting interoperability requirements, one of Clojure’s simpler type-definition forms may suit your needs better. (Chas Emerick)

Eu já precisei usar um misto de Protocols, types e Proxy como você pode ver aqui. Era justamente um caso de interoperabilidade com classe puramente Java, e obtive um ótimo resultado.

Espero que o flowchart seja útil para você também.

Update 2011-11-17 07:46 pm UTC: Chas teve uma grande ideia! Ele criou um repositório no Github onde é possível contribuir com traduções para este chart, que é dos mais úteis que já vi. Ele me acionou pelo twitter e tive o prazer em fazer a versão em Português para colocar no repo. O chart original estará publicado em seu livro Clojure Programming – que sai no final deste ano.

Written by paulosuzart

agosto 22, 2011 at 6:34 pm

Publicado em clojure, coding

Tagged with , ,

Stream Server com Clojure e Aleph

with one comment

Hoje vou ser objetivo e já começo com o código:

(ns NewStream.core
	(:use [aleph.http])
	(:require [lamina.core :as l]
	          [beanstalk.core :as b]))

	(def beans (b/new-beanstalk "192.168.0.105" 11300))

	(defn init
		[ch]
		(l/receive-all ch (fn[_]))
		(future
			(loop [job (b/reserve beans)]
				(l/enqueue ch (:payload job))
				(b/delete beans (:id job))
				(recur (b/reserve beans)))))

	(defn handler
		[ch requet]
		(let [stream (l/named-channel :news-stream init)]
			(l/enqueue ch
				{:status 200
				 :headers {"content-type" "text/html"}
				 :body (l/fork stream)})))

	(defn -main[& args]
		(start-http-server handler {:port 8089}))

E mais objetivo ainda eu digo: O Aleph é simplesmente sensacional! É um framework de comunicação assíncrona feito com o excelente JBoss Netty e um framework muito completo para programações baseada em eventos do mesmo autor do Aleph, o Lamina.

O Lamina usa canais como cidadãos de primeiro nível e compartilha o mesmo princípio de canais em Go. Mas é muuuuuuito mais poderoso.

O código acima nasceu de um desafio lançado para @abraaoisvi, @lucastex, @rafaelfelini e eu (@paulosuzart). O desafio era fazer um servidor de stream de notícias de um dado evento sem usar websocket e algumas outras restrições que não vem ao caso.

Na minha solução, tenho um servidor beanstalkd rodando num linux. Este servidor recebe mensagens de uma aplicação usada por um editor de notícias fictícia (na verdade um código tosco em python meu mesmo). E cada cliente que conecta no Aleph, vai passar então a receber as notícias uma vez emitidas pelo editor.

O código acima tem handler como a função que recebe as requisições de um browser, por exemplo. Veja que nela, stream é um canal que recebe todas as mensagens vindas do beanstalkd. O detalhe é:news-stream que é o nome dado ao canal de mensagens. Isto é, existirá apenas um canal com este nome no servidor.

init é a função que inicializa o canal stream (recebido como parâmetro ch). Como a função reserve da lib beanstalk é blocking, executo ela em outra thread usando future, e a cada nova mensagem recebida, faço o enqueue no canal stream.

O http handler responde imediatamente para o Browser com status 200 OK, mas o body é um channel que sofreu um fork do canal stream. O fork permite que cada cliente receba uma cópia das mensagens de stream a partir do momento em que fez o fork. O Lamina se encarrega de repassar todas as mensages de stream para os canais gerados a partir do fork.

Com um body sendo um channel, o Aleph vai responder a requisição usando uma resposta Chunked.

Ao acessar http://localhost:8089, o Browser vai manter a conexão aberta. Cada nova mensagem emitida será então enviada imediatamente para cada browser pendurado no server. Simples assim :)

Aleph + Lamina, ta aí uma boa combinação para tirar o máximo do seus processadores! Até a próxima.

Update: Algumas pessoas me perguntaram como rodar este pequeno programa. Você pode usar o Leiningen com o seguinte project.clj:


(defproject NewStream "1.0.0-SNAPSHOT"
  :description "Simple news stream server"
  :dependencies [[org.clojure/clojure "1.2.1"]
                 [lamina "0.4.0-beta2-SNAPSHOT"]
                 [aleph "0.2.0-beta2-SNAPSHOT"]
                 [org.clojars.bengl3rt/beanstalk "1.0.2"]]
  :main NewStream.core)

Depois é só executar lein deps e então lein run. Ah, não esquece de ter um Servidor beanstalkd rodando.

Written by paulosuzart

agosto 15, 2011 at 12:19 am

Publicado em clojure

Tagged with ,

Golang – Templates e formatters

leave a comment »

Adivinhou! Irei escrever: “Quanto tempo sem postar no blog!” É isso mesmo. Quanto tempo!

Se você tem acompanhado meus tweets, deve ter notado que estou focado em Go. Bom, na verdade não estou twittando ou postando no blog sobre Go como fiz com Scala e Clojure por alguns motivos. Mas é proposital.

Não aguentei me segurar e segue uma dica sobre templates em Go. Existem outras soluções, até mesmo mais simples, para o problema. Mas resolvi fazer dessa forma para não interferir nos dados da aplicação por questão de apresentação e visualização de dados.

var CustomFormatter = template.FormatterMap{
    "f2mi": func(w io.Writer, format string, value ...interface{}) {
                 fmt.Fprint(w, strconv.Ftoa64(value[0].(float64)/1000000, 'f', -1))
    },
    "i2mi": func(w io.Writer, format string, value ...interface{}) {
        fmt.Fprintf(w, strconv.Ftoa64(float64(value[0].(int64))/1000000, 'f', -1))
    },
}

var OutPutTemplate = `
=========================================================================
Test Summary (gb. Version: 0.0.2 alpha)
-------------------------------------------------------------------------
Total Go Benchmark Time         | {Elapsed|i2mi} milisecs
Requests Performed              | {TotalSuc}
Requests Lost                   | {TotalErr}
Average Response Time           | {Avg|f2mi} milisecs
Max Response Time               | {Max|i2mi} milisecs
Min Response Time               | {Min|i2mi} milisecs
`
//The resunting summary of a master
type Summary struct {
    Start, End         int64
    TotalSuc, TotalErr int
    Min, Max           int64
    Avg                float64
    Elapsed            int64
}

func (self *Summary) String() string {
    t := template.MustParse(OutPutTemplate, CustomFormatter)
    sw := new(StringWritter)
    t.Execute(sw, self)
    return sw.s
}

Wow! O que está acontecendo aqui? Bem, começando pela variável OutPutTemplate, temos o template usado no GoBenchmark como saída no final do teste.

Note que entre as chaves ({}) estão exatamente os campos da struct Summary, definida mais abaixo. a função (self *Summary) String() em Go, é o correspondente do método .toString() em Java. Ok? Acontece que os campos com in64 estão guardando valores em nanosegundos. Mas para o usuário final desejo mostrar em milisegundos.

E por que não dividir cada campo por 10 elevada à 6 potência? Realmente daria, mas precisaria cuidar disso no meu código da aplicação, e não quero isso.

Uma solução é combinar ao template alguns formatadores de valor. Por isso a média (campo Avg) é representada no template por {Avg|f2mi}, isto é, {Campo|formatador}. Note que em String(), ao efetuar o parse do template eu uso o CustomFormatter para indicar quais os formatadores usados.

É possível usar reflection para, em um mesmo formatador, decidir se o argumento value é um int64 ou float64. Mas, prefiro deixar reflection pra situações realmente relevantes.

É isso! Os formatadores são boas opções e permite soluções criativas.

Se você não me segue no twitter, aproveite: @paulosuzart. Até a próxima!

Written by paulosuzart

julho 1, 2011 at 7:30 am

Publicado em golang

Tagged with ,

Clojure + Coherence = Cloherence

leave a comment »

Que combinação! Datagrid Coherence e Clojure! O último post deu uma prévia da abstração simples em cima do Coherence que venho escrevendo. Na verdade não há nada demais nela, a não ser permitir o acesso aos caches e ao processamento de entradas no datagrid de forma mais natural em Clojure. O Cloherence permite duas semânticas, uma que é uma pequena DSL para operações de put, get, remove put de sequencias e processamento no cluster. Vamos a elas:

    (def a1 {:name "Nacho" :breed "Bulldog"})
    (def a2 {:name "Sushi" :breed "Shire"})
    (with-cache "dogs"
        (put-val 1 a1)
        (println (get-val 1)))
;; put a1 into a named cache "dogs" and print the value get from 1
    (with-cache "dogs"
        (put-seq :name (list a1 a2)))
;; put a1 and a2 using :name as key

A função put-seq é interessante pra casos onde alguma função retorna uma lista, e esta pode ser “cacheada” de uma vez. Acontece é que NamedCaches no Coherence são herdeiros de java.util.Map. E isso me deu a ideia de usar a mesma semântica de maps em clojure para tratar os caches Coherence. E ficamos assim:

    (cache-map cats)
    (assoc cats 1 {:name "chico" :breed :unknown})
    (get cats 1) ;; {:name "chico" :breed :unknown}
    (inplace-update cats 1
        (fn [e]
            {:name (.toUpperCase (:name e)) :breed "none"}))
;;put {:name "CHICO" :breed "none"} in the cache with key 1

inplace-update não existe em clojure. A lib oferece uma função update para se assemelhar à função update-in, com a diferença que não permite chaves encadeadas.

A função inplace-update emite um Entry Processor para o grid, e no nó do DataGrid que reside a entrada, a função f é invocada com a entrada passada como argumento. A vantagem é não trazer para a JVM que emite o processador, a entrada encontrada. Escalando isso, livramos a JVM da aplicação de receber possíveis milhares de entradas do cache para efetuar a alteração nas entradas.

Vamos examinar o par EntryProcessor mais a função inplace-update:


;;PProcess é do pacote .core

(deftype CljProcessor
    [f args] java.io.Serializable PProcessor
        (process [this entry]
	(apply f (.getValue entry) args)))

(defn inplace-update
    [cache e-key f & args]
        (with-cache cache
        (process e-key (cloherence.maps.CljProcessor. f args))))

Aqui conto com a função process, com a própria DSL da lib with-cache e com o protocol PProcessor. f de inplace-update é executada assim que a entrada é encontrada, recebendo o valor como primeiro argumento e &args como restante dos argumentos.

Bom, além de divertido, a lib cloherence se propõe a dar uma melhor aderência dos caches Coherence com Clojure. Como próximos passos (não sei se vou fazer, mas pretendo), pretendo implementar inplace-update para várias chaves, iplementar locks e utilizar primitivas de concorrência clojure para algumas operações no cache.

É isso, boa diversão!

@paulosuzart

P.S. Gostaria de um feedback pra saber que nível seria mais adequado abordar Clojure aqui no blog. As vezes sinto que estou escrevendo coisas sem ter feito uma base como fiz com os posts sobre Scala. Quem quiser pode dar um feed. ;)

Written by paulosuzart

abril 3, 2011 at 8:00 am

Publicado em clojure, coherence

OO Funcional: Clojure, Coherence e JavaScript

with 2 comments

Nossa! Estou escrevendo cada vez menos. Isso me deixa um pouco triste. Mas é consequencia de algumas mudanças, até agora positivas.

Durante o carnaval decidi implementar uma ideia que havia comentado com @danielamadei. É uma idea simples: Criar uma fina camada REST em cima do Coherence, expandindo assim sua aplicabilidade para além do Java, .Net e C. Bom, o objetivo mesmo é estudar e aplicar o que tenho aprendido em algum caso que eventualmente pode se tornar útil. A mistura de Coherence com Clojure e Javascript motivou a elaboração do post e o título dele.

O resultado foi: Clojure, Ring, Rhino e Moustache. As libs contrib usadas foram: Duck-streams, json e string.

Mas, antes tentei fazer uma coisa mais louca com Aleph e Lamina. Aleph é um framework de comunicação  assíncrono escrito sobre lamina e JBoss Netty criado pelo mesmo autor do Lamina. É interessante, mas o Aleph acabou se mostrando com um nível de maturidade insuficiente para o que queria fazer, embora fosse simples.

Na lib que dei o nome de CoheREST, fiz a parte de inserção e busca pela chave. A parte mais interessante foi usar o Rhino pra executar funções Javascript submetidas via http para o servidor Ring. Bom, a abstração para acesso ao Coherence ficou assim:

    (with-cache "My-Cache"
        (put-val 1 {"name" "Paulo" "age" 20}))

É isso mesmo, basta esse código para iniciar, criar e inserir um Map com a chave 1 no cache de nome “My-Cache”. Analogamente, pare obter o valor, basta usar uma função chamada get-val. Mas isso foi só pra ilustrar como ficou a simples abstração.

Ok! O Coherence tem uma feature muito interessante. Ao invés de pesquisar no cache uma certa quantidade de entradas, efetuar algum tipo de operação e depois submeter as mudanças ao cache, ele permite que o processamento seja emitido por todo o cache (EntryProcessor). Isto faz com que o processamento ocorra localmente – no nó do grid em que a entrada reside – sem onerar o nó emissor do processamento. Isto é obtido emitindo para o cache uma implementação de AbstractProcessor.

Para emitir um Entry Processor, é possível fazer como se faz para por ou resgatar uma entrada no cache:

    (with-cache "My-Cache"
        (process 1 (coherest.processor.JSProcessor. some-js)))

Só uma observação, nesta versão implementei a emissão de um EntryProcessor para uma única entrada, aqui com a chave 1. E agora começa a parte interessante. coherest.processor.JSProcessor é executado por um EntryProcessor (apresentado mais abaixo), e é ele quem executa javascript no cluster, desde que o javascript tenha o seguinte formato:

    function(e) {//e é a entrada no cache
         e.age = e.age + 1;
         return e;
     }

Isto é, caso a entrada seja encontrada, ela será passada no formato JSON para a função que pode alterar a entrada e retornar o resultado do processamento. Aqui o exemplo é um  simples incremento da propriedade age da entrada. A função é a string some-js passada na construção do JSProcessor. E é aqui que o OO funcional começa.

JSProcessor é um type que implementa um Protocol (leia-se interface em clojure) que define apenas uma função: process. O Protocol e o type ficam assim:

    (defprotocol PProcessor
        (process [this entry]))

    (deftype JSProcessor
		[^String script] java.io.Serializable PProcessor
		(process [this entry]
                       ;; Implementation went here))

Simples, o Coherence vai invocar apenas o método process(entry) na Implementação de AbstractProcessor. Como o processor é espalhado pelo cluster, ele também precisa implementar Serializable. Mas no início do post falei que um EntryProcessor deve implementar AbstractProcessor, mas esta classe não apareceu em lugar nenhum aqui até agora. Acontece que por questões de design, meu Protocol PProcessor é na verdade invocado por uma implementação anonima de AbstractProcess. Esta implementação anonima é que contem a implementação do método process, que por sua vez se encarrega em a função process do JSProcessor, passando como argumento a entrada encontrada no cache. Veja como ficou:

(defn make-processor
	"Create a valid Coherence EntryProcessor from the PProcessor passed
	 as agurment"
	[processor]
	(proxy [AbstractProcessor] []
	    (process [entry]
		(process processor entry))))

Ufa! make-processor é uma função que recebe a instância de JSProcessor, cria um proxy de AbstractProcessor, onde sua implementação é justamente a invocação da função process nele passando a entrada encontrada. A implementação de AbstractProcessor não passa de uma porta de entrada para a invocação das funções definidas pelo PProcessor. E usar um Protocol para o carro chefe na execução de funções no cluster permite que criemos instâncias deste protocol que façam o que desejarmos. O JSProcessor no caso, usa o Rhino pra executar funões no grid.

O CoheREST foi feito sem nenhuma intenção comercial, tão pouco para uso em ambiente corporativo. Isto por que ainda preciso verificar algumas questões de licença. Aí posso liberar o fonte no meu github. O post já foi bastante longo e não pude entrar em detalhes sobre o CoheREST ou sobre o Ring e o Rhino sendo usado direto em Clojure. Mas fica uma deixa pra próximos posts.

Bom, e aqui tivemos herança, programação com interfaces, etc, tudo em clojure, uma linguagem não orientada a objetos, mas que não nos limita em nada a usar conceitos OO. Obrigado e lembre-se: @paulosuzart.

Written by paulosuzart

março 14, 2011 at 1:07 pm

Publicado em clojure, coherence

Tagged with ,

Seguir

Obtenha todo post novo entregue na sua caixa de entrada.