Émulation du bootloader de NotPetya avec Miasm

MISC

n°

juillet 2018

Par

Tag(s)

Miasm

NotPetya est un célèbre malware issu de la famille Petya, apparu en juin 2017. La partie s'exécutant depuis le MBR a souvent été étudiée en statique ou en dynamique grâce au débogueur Bochs pour IDA. Une autre approche d'analyse est-elle possible ? Nous proposons ici d'émuler pas à pas le bootloader de NotPetya en utilisant Miasm.

1. Rappel

NotPetya est un malware issu de la famille bien connue des ransomwares Petya. Cette variante est apparue pour la première fois au cours du mois de juin 2017 en Ukraine. D'après Mikko Hyppönen, Chief Research Officer chez F-Secure, le vecteur d'infection serait le mécanisme de mise à jour du logiciel de comptabilité M.E.Doc, largement déployé dans les pays de l'Est.

Cette famille de malware a la particularité d'écraser le bootloader de la machine compromise afin de chiffrer une partie du disque dur à son redémarrage. Cet article utilise ce bootloader comme prétexte à un tutoriel sur l'émulation et le reverse de ces petites bêtes grâce au framework de reverse engineering Miasm. Le code associé est disponible à cette adresse : https://github.com/aguinet/miasm-bootloader/. Il contient une implémentation en Python d'un sous-ensemble des interfaces d'un BIOS de PC x86 classique. Le code a été écrit de façon à ce qu'il soit réutilisable facilement pour d'autres cas, voire pour aider au développement/débogage de bootloaders.

1.1 Travaux associés

Des articles ainsi que de nombreux blogposts ont déjà étudié les mécanismes de compromission et d'infection du MBR de NotPetya, ainsi que l'étude de l'implémentation de ses différents mécanismes cryptographiques (et de leurs défauts). En voici quelques-uns notables :

MISC n°86 : « Pleased to meet you, my name is Petya ! » écrit en juillet 2016 par Damien Schaeffer ;
MISC n°93 : « Petya or Not Petya, that is the question » écrit en septembre 2017 par Teddy et Benjamin. Il aborde de manière précise les mécanismes de démarrage d'un système et propose une rétroconception du code du bootloader ;
Crowstrike : « Full Decryption of Systems Encrypted by Petya/NotPetya » [1]. Étude d'une erreur d'implémentation de l'algorithme Salsa20 dans le bootloader.

1.2 NotPetya

Cette section n’aborde que d’une manière très généraliste le cycle de vie du malware. Cela permet de mettre en lumière la partie étudiée dans cet article.

Une fois que NotPetya s’est exécuté sur la machine, il génère une clé de chiffrement AES qui va être utilisée pour réaliser la première phase de chiffrement des données de l’utilisateur. Cette clé est elle-même chiffrée avec une clé publique RSA.

Le malware vérifie ensuite que le système utilise un schéma de partition classique et, s’il en a les droits, inscrit ses propres données sur les premiers secteurs du disque (de 1 à 18, puis 32 à 34), dont le MBR dans le premier secteur. Si le système utilise UEFI (avec donc un schéma de partition GPT), le malware ne continue pas les opérations. La machine est ensuite redémarrée et le bootloader de NotPetya est exécuté : une clé Salsa20 et un nonce sont générés. Ces secrets sont utilisés pour chiffrer la Master File Table (MFT)[2] du système de fichiers NTFS. Cette structure de donnée contient les métadonnées permettant de retrouver les données associées à chaque fichier. Cette opération prend l’allure d’un « chkdsk ». Une fois cette opération réalisée, la machine redémarre une dernière fois et s’affiche alors le message de demande de rançon.

1.3 Miasm

Miasm est un framework de reverse engineering développé en Python. Brièvement, il permet :

d'ouvrir, modifier et générer des binaires au format PE, ELF 32, 64 LE, BE ;
d’assembler/désassembler du code x86, ARM, MIPS, SH4, PPC et MSP430 ;
représenter la sémantique des instructions via une représentation intermédiaire ;
émuler du code avec un moteur de JIT (Just In Time compilation) ;
simplifier des expressions, utilisées par exemple pour la désobfuscation de code obfusqué.

1.4 Pourquoi émuler NotPetya avec Miasm ? (dit autrement, pourquoi se faire autant de mal ?)

Il existe différentes façons d'émuler un bootloader. Une approche classique est d'utiliser QEMU (ou toute autre solution de virtualisation) en écrivant le bootloader sur un disque dur virtuel, mais cela permet difficilement d'instrumenter le code de ce bootloader. Une telle chose est cependant possible via le débogueur Bochs pour IDA. Cette approche a été adoptée par Teddy et Benjamin dans MISC n°93, mais aussi par Saurabh Sharma [3]. Cette méthode a fait ses preuves et permet de déboguer un bootloader assez facilement.

Dans l'article associé à la présentation de son outil Miasm à SSTIC en 2012 [4], Fabrice Desclaux en présentait les possibilités offertes. L'une des applications proposées était l'émulation d'un bootloader.

Pouvoir émuler complètement le bootloader (jusqu'aux interruptions du BIOS) avec un framework comme Miasm donne un contrôle plus fin sur ce qu'il se passe, permet éventuellement de le désobfusquer, et/ou d'utiliser tous les outils développés dans Miasm pour aider le reverseur dans cette tâche. Il devient par exemple très simple d'instrumenter le code afin de voir les données/lues écrites sur le disque, les secrets générés, etc.

Enfin, le code du bootloader de Petya étant succinct, non obfusqué et extrêmement simple (il tourne en mode réel, en 16 bits et ne fait appel qu'à quelques interruptions du BIOS), c'est un cas d'école de choix pour prendre en main Miasm !

2. Fonctionnement d'un bootloader PC/x86

2.1 Généralités

Nous n'abordons ici que le fonctionnement d'un bootloader avec un BIOS « à l'ancienne ». Nous n'aborderons pas ici les mécanismes de démarrage utilisant l’UEFI.

Sur un PC x86, lorsque la machine démarre, le BIOS va charger le premier secteur du disque (Master Boot Record ou MBR) à l'adresse 0x7C00, puis y transférer le flot d'exécution. Le MBR contient donc le code du bootloader. Pour le moment, le processeur ne supporte que les instructions 16 bits et ne peut adresser la mémoire qu'en mode réel [5].

Pour rappel, un secteur de disque contient 512 octets. Par conséquent, il n'est pas possible de stocker beaucoup de code sur celui-ci. C'est pourquoi les bootloaders sont généralement conçus en plusieurs parties, aussi appelées stages. Ainsi le bootloader stocké dans le MBR va, par exemple, charger et exécuter le stage 2 contenu dans le secteur 2.

2.2 Dans le cas de NotPetya

NotPetya fonctionne exactement de cette manière. Le bootstrap code correspond au code assembleur ci-dessous. La primitive à l'adresse 0x7C38, c’est-à-dire disk_read_stage2, va écrire le contenu des secteurs 2 à 34 (inclus) à l'adresse 0x8000 puis transférer l'exécution à cette adresse.

seg000:7C00 cli

seg000:7C01 xor ax, ax

seg000:7C03 mov ds, ax

seg000:7C05 mov ss, ax

seg000:7C07 mov es, ax

seg000:7C09 lea sp, start

seg000:7C0D sti

seg000:7C0E mov eax, 32

seg000:7C14 mov byte ptr ds:word_7C93, dl

seg000:7C18 mov ebx, 1

seg000:7C1E mov cx, 8000h

seg000:7C21 call disk_read_stage2

seg000:7C24 dec eax

seg000:7C26 cmp eax, 0

seg000:7C2A jnz short loc_7C21

seg000:7C2C mov eax, dword ptr ds:8000h

seg000:7C30 jmp far ptr 0:8000h

3. Émulation avec Miasm

3.1 Installation

Le système hôte utilisé pour ces tests est basé sur Linux. Les utilisateurs de Windows 10 devraient pouvoir faire fonctionner tout cela en utilisant le très pratique Windows Subsystem for Linux (WSL pour les intimes), en installant par exemple Ubuntu à travers le Windows Store [6].

Nous conseillons d'utiliser la version de Miasm spécifiée dans le fichier README du dépôt GitHub. À l'heure où sont écrites ces lignes, la version utilisée est associée à l'empreinte dadfaabc3fff5edb9bf4ef7e7e8c4cfc4baccb94. Pour récupérer cette version spécifique, faire :

$ git clone --depth=1 -odadfaabc3fff5edb9bf4ef7e7e8c4cfc4baccb94https://github.com/cea-sec/miasm/

Nous utilisons le moteur de JIT de Miasm basé sur LLVM. Pour cela, le paquet python llvmlite est nécessaire. D'autres dépendances sont nécessaires à Miasm et au projet en soi. Elles sont installables directement grâce au fichier requirements.txt fourni :

$ cd /path/to/src && pip install -r requirements.txt

Il suffit ensuite d'installer Miasm :

$ cd /path/to/miasm && python ./setup.py install

3.2 Implémentation

Toutes les techniques décrites ici peuvent être testées grâce au script src/emulate_mbr.py, présent dans le dépôt GitHub cité au début de cet article. Les différentes options disponibles sont accessibles en utilisant le drapeau --help.

3.3 Création d'un disque de test

Nous avons réalisé nos tests avec des machines virtuelles sous Windows XP et Windows 10. L'hyperviseur utilisé importe peu (VMWare, VirtualBox), tant que le disque créé est de taille fixe et au format VMDK. Ainsi, l'émulation du bootloader se fait directement sur le disque de la machine virtuelle. Un avantage à cette méthode est qu'il n'y a pas besoin d'extraire le bootloader de la DLL d'origine du malware ou bien depuis le disque à la main.

Fig. 1 : Scénario d'émulation.

Le scénario de test est le suivant :

Infection volontaire de la machine virtuelle avec NotPetya ;
Attente d'environ 10s (la machine ne doit pas redémarrer seule au risque que le chiffrement effectué par le bootloader soit lancé) ;
Arrêt de la machine virtuelle : le MBR est maintenant infecté ;
Lancement de l'émulation : chiffrement de la MFT par le bootloader puis affichage du message de rançon.

Si votre machine virtuelle n'est pas au bon format de disque, vous pouvez toujours le convertir au format RAW grâce à QEMU :

$ qemu-img convert -f vmdk mydisk.vmdk -O raw mydisk.raw

Nous fournissons de plus une image de test disponible dans le dépôt Git référencé en introduction (fichier disk.raw.bz2). Cette image décompressée fait environ 1Go, et contient une simple partition NTFS avec quelques fichiers de test.

Nous pouvons maintenant émuler le bootloader de NotPetya. Pour cela, il faut émuler un BIOS capable de :

lecture/écriture sur les secteurs du disque ;
l'affichage des caractères sur le moniteur ;
la saisie des caractères au clavier ;
démarrer sur un MBR (re/démarrage léger).

La suite de l'article décrit comment implémenter tout cela à travers Miasm.

3.4 Abstraction système

Nous implémentons une abstraction d'un système simple tel que vu par le BIOS. Il comprend :

un disque dur virtuel (classe HardDrive) ;
un affichage vidéo, qui passe par un terminal classique Unix, à travers le pipe stdout ;
un clavier, qui utilise le pipe stdin pour récupérer les frappes clavier (fonctions de async_kb.py).

L'abstraction est soutenue par la classe System, dont une instance est utilisée tout au long de l'émulation. Celle-ci est initialisée en même temps que la VM Miasm.

3.5 Initialisation de la VM Miasm

Comme annoncé en introduction, le code du MBR est chargé et exécuté à l'adresse 0x7C00 par le BIOS, qui écrira et exécutera son stage 2 à l'adresse 0x8000. L'espace restant est dédié à la pile et commence à l'adresse 0x500 pour terminer à l'adresse 0x07C00 [7], c'est-à-dire l'espace [0x00000500:0x00007BFF].

Nous initialisons donc dans un premier temps la VM Miasm pour déclarer ces espaces mémoire, en mettant le premier secteur (MBR) à l'adresse 0x7C00 :

HD0 = HardDrive(hd_path)

sys_ = System([HD0])

mbr = HD0.read_sector(0)

stage1_addr = 0x07C00

stage2_addr = 0x08000

jitter.vm.add_memory_page(stage1_addr, PAGE_READ | PAGE_WRITE | PAGE_EXEC, mbr, "NotPetyaS1")

jitter.vm.add_memory_page(stage2_addr, PAGE_READ | PAGE_WRITE | PAGE_EXEC, "\x00"*SECTOR_LEN*32, "NotPetyaS2")

jitter.vm.add_memory_page(0x500, PAGE_READ | PAGE_WRITE, "\x00"*(0x7C00-0x500+1), "Stack")
# Affiche l’état de la mémoire

L’état de la mémoire au sein de la VM Miasm est ainsi le suivant :

Addr               Size               Access Comment
0x500              0x7700             RW_    Stack
0x7C00             0x200              RWX    NotPetyaS1
0x8000             0x4000             RWX    NotPetyaS2

NotPetya charge 32 secteurs du disque en mémoire lors de l'exécution du stage 1. C'est pourquoi l'espace mémoire alloué au stage 2 est de 32 secteurs.

3.6 Gestion des interruptions dans Miasm

Miasm permet de spécifier un gestionnaire d'interruption qu'il appellera à chaque fois que l'instruction INT est rencontrée. Pour cela, il suffit d'appeler la fonction add_exception_handler du jitter utilisé :

jitter.add_exception_handler(EXCEPT_INT_XX, lambda jitter: exception_int(jitter, sys_))

Nous pouvons ensuite appeler notre implémentation Python du BIOS à partir de la fonction exception_int.

3.7 Support des différentes interruptions

Il convient maintenant d'écrire les gestionnaires d'interruption du BIOS. Nous distinguons 4 familles d'interruptions à implémenter pour émuler NotPetya :

INT 10h : accès au moniteur (écriture de caractères, couleurs…) ;
INT 13h : accès au disque (lecture, écriture, géométrie…) ;
INT 16h : accès au clavier (lecture des frappes) ;
INT 19h : démarrage sur le MBR d'un disque.

3.7.1 INT 13h

Pour illustrer nos propos, voici une implémentation de l'interruption 13havec le code de fonction 0x43(Extended Read Sectors From Drive). Ce code correspond au chargement d'un ou plusieurs secteurs du disque vers la mémoire RAM. Le code Python présenté ici ne contient pas la gestion des erreurs pour des raisons de lisibilité. L'objet sys_correspond à l'abstraction du système proposée en section 3.4.

@func(disk_interrupts, 0x42)

def extended_read_sectors(jitter, sys_):

drive_idx = get_xl(jitter.cpu.DX)

print "Extended read sectors, drive idx 0x%x" % drive_idx

dap = jitter.vm.get_mem((jitter.cpu.DS << 4)+jitter.cpu.SI, 16)
dap_size, _, num_sect, buff_addr, abs_sect = struct.unpack("<BBHIQ", dap)

hd = sys_.hd(drive_idx)

print(" Read %d sectors from sector %d" % (num_sect, abs_sect))

size = num_sect * SECTOR_LEN

data = hd.read(abs_sect * SECTOR_LEN, size)

jitter.cpu.cf = 0 # No error

# AL is the number of sectors read

# AH is the return code, 0 = successful completion

jitter.cpu.AX = set_16bit_reg(low=int(len(data) / SECTOR_LEN), high=0)

jitter.vm.set_mem(buff_addr, data)

Il existe deux manières d'accéder à des données sur le disque, en utilisant deux adressages différents pour la même interruption 13h :

L'adressage CHS (Cylinder, Head, Sector), utilisé par le code 02h/03h. Il permet de lire/écrire un ou plusieurs secteurs en spécifiant le numéro de cylindre et de tête.
L'adressage LBA (Logical Bloc Adressing), utilisé par le code 42h/43h permet de lire/écrire un ou plusieurs secteurs en spécifiant le secteur de manière absolue, c'est-à-dire à partir du début du disque en faisant abstraction des têtes et des cylindres.

NotPetya utilise l'adressage LBA nécessitant l'usage d'un DAP (Disk Address Packet). Il s’agit d’une structure de données décrivant quels secteurs lire et où placer les données lues.

Nous noterons qu'il existe une structure étendue permettant de charger plus de secteurs (mode LBA étendu).

Offset	Taille	Description
0	1	Taille du paquet
1	1	Toujours à zéro
2	2	Nombre de secteurs à charger
4	4	Buffer où charger les données (seg:off)
8	8	Numéro absolu du secteur à lire

Pour résumer :

Le DAP est parsé ;
Les données sont lues depuis le disque virtuel ;
Les données lues sont inscrites dans la page mémoire de la VM Miasm instanciée.

Le mécanisme d'écriture sur le disque est l'exact opposé : l'adresse mémoire spécifiée contient les données à écrire sur le disque.

3.7.2 INT 19h

Le second exemple choisi est l'interruption 19h (diskboot), qui permet de redémarrer la machine [8][9]. Elle est utilisée à deux endroits :

dans la procédure à l'adresse 0x892E, appelée lorsqu'une erreur fatale survient ;
au redémarrage après le chiffrement des entrées de la MFT (adresse 0x820D).

L'interruption 19h est exécutée après la procédure POST (Power On Self Test) par le BIOS. Le MBR est alors chargé depuis le disque et le BIOS donne le contrôle au code situé à l'adresse Ox7C00. Ce n'est donc pas un redémarrage complet, mais plutôt une instruction permettant de démarrer à partir d'un disque. Cette instruction fait partie du processus de boot après exécution du BIOS. Certains BIOS permettent de gérer les priorités de boot, tandis que d'autres bouclent sur les différents disques disponibles jusqu'à trouver sur lequel il peut démarrer.

Nous allons donc émuler cette instruction en chargeant à nouveau le MBR dans la page mémoire dédiée au stage 1, et en sautant ensuite sur l'adresse 0x7C00 :

diskboot_interrupts = FuncTable("INT 19h (diskboot)")

@func(diskboot_interrupts, 0x02)

def reboot(jitter, sys_):

# Here, we assume only one bootable disk (index 0)

hd = sys_.hd(0)

mbr = hd.read_sector(0)

jitter.vm.set_mem(0x7C00, mbr)

jitter.pc = 0x7C00

3.8 Et pour quelques hacks de plus...

L'instruction STI (Set Interrupt Flag) est utilisée à l'adresse 0x7C0D. Elle permet d'activer les interruptions masquables (flag IF, offset 9 du registre FLAGS). Ce flag n'a pas d'effet sur les interruptions non masquables. Les interruptions provenant du matériel étant entièrement émulées, Miasm ne contient pas (légitimement) de sémantique pour cette instruction.

Nous décidons donc de l'ignorer en posant un breakpoint à l'adresse spécifiée :

jitter.add_breakpoint(0x7C0D, handle_sti)

puis de faire passer PC à l'instruction suivante. Sachant que l'opcode de l'instruction STI (0xFB) ne fait qu'un octet, une simple incrémentation de PC suffit :

def handle_sti(jitter):

jitter.pc += 1

return True

3.9 Yippie kay yay motherfucker !

Maintenant que les différents gestionnaires ont été écrits, et que le code du MBR est chargé puis mappé dans Miasm, l'émulation peut commencer :

jitter.init_run(stage1_addr)

jitter.continue_run()

Avec le drapeau --verbose-bios-data (voir section 3.2), la sortie de notre programme affiche directement le contenu des lectures/écritures du disque. Par exemple, voici le contenu du second secteur (sur les 32 chargés par le bootloader à l'adresse 0x8000) :

Extended read sectors, drive idx 0x0

Read 1 sectors from sector 2

00000000: 50 FF 76 04 E8 91 0A 83 C4 0A E8 3B 07 CD 19 5E P.v........;...^

00000010: C9 C3 6A 0E E8 39 07 5B 68 70 9C E8 C0 03 5B C3 ..j..9.[hp....[.

00000020: C8 04 04 00 56 6A 00 6A 01 6A 00 6A 20 8D 86 FC ....Vj.j.j.j ...

00000030: FD 50 8A 46 06 50 E8 21 0A 83 C4 0C 6A 00 68 8E .P.F.P.!....j.h.

[...]

Le code chargé correspond à celui du stage 2. Nous observons aussi facilement le chargement du secteur 32 :

Extended read sectors, drive idx 0x80

Read 1 sectors from sector 32

00000000: 00 AA 92 E7 82 11 15 D3 20 96 A7 75 51 C0 36 08 ........ ..uQ.6.

00000010: E8 65 42 8C 73 9F 06 53 77 CB C5 95 60 C8 38 69 .eB.s..Sw...`.8i

00000020: 9B 0D A4 99 E0 13 12 30 79 31 4D 7A 37 31 35 33 .......0y1Mz7153

00000030: 48 4D 75 78 58 54 75 52 32 52 31 74 37 38 6D 47 HMuxXTuR2R1t78mG

00000040: 53 64 7A 61 41 74 4E 62 42 57 58 00 00 00 00 00 SdzaAtNbBWX.....

00000050: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

00000060: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

00000070: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

00000080: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

00000090: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

000000A0: 00 00 00 00 00 00 00 00 00 48 34 79 5A 73 77 56 .........H4yZswV

000000B0: 54 64 43 6B 43 77 55 68 72 31 4D 52 6D 4A 65 69 TdCkCwUhr1MRmJei

000000C0: 76 31 34 46 4B 39 6A 5A 6A 4D 36 36 4C 44 79 65 v14FK9jZjM66LDye

000000D0: 71 52 4C 64 6B 38 53 58 53 53 73 53 53 45 78 34 qRLdk8SXSSsSSEx4

000000E0: 44 51 57 4E 47 00 00 00 00 00 00 00 00 00 00 00 DQWNG...........

000000F0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

[...]

000001F0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ...............

D'après la description faite de ce secteur dans [MISC 93], nous pouvons en déduire :

l'indicateur de chiffrement du disque : 0x00 ;
la clé Salsa20 de 32 octets : AA 92 E7 82 11 15 D3 20 96 A7 75 51 C0 36 08 E8 65 42 8C 73 9F 06 53 77 CB C5 95 60 C8 38 69 ;
un nonce de 8 octets : 0D A4 99 E0 13 12 30 79 ;
la chaîne aléatoire générée par le malware lors de son lancement sous Windows, qui est affichée dans la rançon.

Après la phase de chiffrement réalisée par le bootloader, la clé et le nonce sont ensuite effacés du disque via 32 réécritures successives de zéros. En outre, nous observons bien le flag de chiffrement du disque passé à 0x01 après le chiffrement :

Extended write sectors, drive idx 0x80

Write 1 sectors at offset 32 (from memory at 0x776A)

00000000: 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

00000010: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................

00000020: 00 0D A4 99 E0 13 12 30 79 31 4D 7A 37 31 35 33 .......0y1Mz7153