Archives mensuelles : juillet 2013

L’échantillonnage facile sous ORACLE

J’ai découvert et testé une méthode d’échantillonnage sous Oracle bigrement facile. Toute la méthode repose sur la pseudo colonne sys_guid(). Cet élément grénère un numéro d’identifiant unique et aléatoire. Il est utilisé sous oracle pour générer les rowid.
En fainsant un group by sur cette pseudo colonne, on trie les lignes aléatoirement. Il ne reste ensuite qu’à prendre les N premières lignes.

Voici le select issu de cette méthode:

create table ECH_TA_DONNEES as
Select tblalias.*
From (select tblfait.*
From TA_DONNEES tblfait
Order by sys_guid ()) tblalias
Where rownum <= 1000;

Je le trouve vraiement très simple et très classe!

Poster un commentaire

Classé dans DATA, RESTITUTION