TSD3060 Eksamen 2022-2023 Konte

Oppgave 1 - Kodeforklaring 10%

Følgende melding sendes fra avsender A til mottaker B i forbindelse med autentisering mot en web-tjeneste:

1: POST /hemmelighetsdatabase/login HTTP/1.1
2: Host: www.hemmelignettsted.no
3: 
4: <?xml version="1.0"?>
5: <bruker> 
6:   <id>      007 </id>
7:   <passord> 700 </passord>
8: </bruker>

Gi en forklaring av koden – både (1) en overordnet forklaring av hensikten med koden og (2) en detaljert linje-for-linje-forklaring.

✅ Sensorveiledning - Overordnet forklaring

Koden er en HTTP POST-forespørsel fra avsender A til mottaker B med formål å autentisere seg mot en web-tjeneste som inneholder en hemmelig database. Forespørselen inneholder brukerinformasjon i form av en ID og passord i XML-format.

✅ Linje-for-linje forklaring

Linje 1: POST /hemmelighetsdatabase/login HTTP/1.1

Angir at dette er en HTTP POST-forespørsel som indikerer at avsender A ønsker å sende informasjon til web-tjenesten. hemmelighetsdatabase/login er URL-en som identifiserer endepunktet for tjenesten. HTTP/1.1 angir versjonen av HTTP-protokollen som brukes i forespørselen.

Linje 2: Host: www.hemmelignettsted.no

Angir navnet på vertsmaskinen som avsender A prøver å koble seg til.

Linje 3: (Tom linje)

Markerer slutten av HTTP-hodet og starten på HTTP-kroppen.

Linje 4: <?xml version="1.0"?>

Angir at resten av dokumentet vil være i XML-format, og at versjonen av XML som brukes er 1.0.

Linje 5: <bruker>

Indikerer at resten av elementene er informasjon om en bruker.

Linje 6: <id>007</id>

Angir brukerens ID, som er satt til 007. ID-en er lukket inne i et XML-element som heter id.

Linje 7: <passord>700</passord>

Angir brukerens passord, som er satt til 700. Passordet er lukket inne i et XML-element som heter passord.

Linje 8: </bruker>

Avslutter XML-elementet bruker, som startet på linje 5, og inneholder all brukerinformasjon i meldingen.

Oppgave 2 - Autentiseringsprosedyre 10%

Skriv et eksempel som viser hvordan meldingen brukes i autentiseringsprosedyren. Pass på å få med beskrivelse av teknologi/språk som brukes både hos A og B. Begrunn valg av teknologi/språk i eksempelet.

✅ Sensorveiledning

Hos A (klient - nettleser):

Kode som kjører i nettleseren bruker standard-språkene for klientside koding:

HTML for brukergrensesnittet
JavaScript for funksjonalitet

Prosess hos A:

Brukergrensesnittet henter inn id og passord fra brukeren ved hjelp av et skjema
Før skjemadataene sendes, blir de lagt i et XML-dokument (som vist i oppgaveteksten)
XML-dokumentet sendes med HTTP POST til serveren

Hos B (server):

Ved mottak av XML-dokumentet blir passordet hashet
Id og passordhashen blir sammenlignet med lagrede verdier
Ved likhet produseres en sesjonsidentifikator
Sesjonsidentifikatoren sendes som informasjonskapsel (cookie) i hodet på HTTP-responsen tilbake til A
Denne sesjonsidentifikatoren vil A bruke i hodet på hver påfølgende HTTP-forespørsel inntil brukeren logger ut (eller sesjonsidentifikatoren går ut på tid)

Valg av teknologi for server (B):

Det er mye mer å velge mellom for tjenerside-koden. Vi har i undervisningen brukt CGI med shell-skript (pedagogiske grunner). Normalt sett brukes dette ikke. Mer utbredt er f.eks. Node, Java, PHP, etc.

Oppgave 3 - Implementering av sending 15%

Forklar og vis med pseudokode/kode hvordan du ville implementert kode som produserer og sender meldingen. Begrunn valg av teknologi/språk. Ta gjerne utgangspunkt i eksemplet du skrev i oppgave 2.

✅ Sensorveiledning

Teknologi: Standard-språkene for web er HTML for brukergrensensnittet og JavaScript for funksjonalitet.

<!doctype html>
<html>
  <head>
    <title> Login </title>
    <meta charset="utf-8">
    <script>
        function login() {

            // Lager referanser til elementer i HTML-dokumentet
            let id = document.querySelector('#id').value;
            let pw = document.querySelector('#pw').value;
            let res = document.querySelector('#respons');

            // Lager XML-dokument til kroppen av HTTP-forespørselen
            let HTTPkropp = '<?xml version="1.0"?><bruker><id>' + id
            HTTPkropp += '</id><passord>' + pw + '</passord></bruker>';

            // ALTERNATIV 1: Sender POST-forespørsel med fetch()
            let basis = 'http://www.hemmelignettsted.no/hemmelighetsdatabase/';
            let url = new URL('login', basis);             
            fetch( url, { method: 'POST', body: HTTPkropp } )
                .then( respons => respons.text() )
                .then( http_kropp => res.innerHTML = http_kropp )

            // ALTERNATIV 2: Sender POST-forespørsel med XMLHttpRequest()
            /*
            let h = new XMLHttpRequest();
            let url = 'http://www.hemmelignettsted.no/hemmelighetsdatabase/login'
            h.open('POST', url, true);  // asynkron = true 
            h.setRequestHeader('Content-type','application/xml');
            h.onload = function() {
              document.getElementById('respons').innerHTML = h.responseText;
            };
            h.send(HTTPkropp);
            */
        }
    </script>
  </head>
  <body>
    Id:      <input id='id' type=text > <br/>
    Passord: <input id='pw' type=text > <br/>
    <button onclick=login()> Login </button>
    <div id='respons'></div> // her kommer responsen 
  </body>
</html>

Oppgave 4 - Mottak og sesjon 20%

Forklar og vis med et eksempel hvordan B (1) mottar meldingen og (2) fullfører autentiseringen og oppretter en sesjon. Bruk kode/pseudokode i svaret. Begrunn valg av teknologi/språk. Ta gjerne utgangspunkt i eksempler fra oppgave 2 og/eller 3.

✅ Sensorveiledning

Det er viktig å få med følgende punkter:

XML-dokumentet leses inn fra standard inngang (STDIN), siden det sendes med POST-metoden
Id og passord plukkes ut av XML-dokumentet
Passordet hashes
Id og passordhashen sammenlignes med lagrede verdier. F.eks. ved oppslag i database (vi har brukt SQLite)
Når passordhashene er like produseres en sesjonsidentifikator som sendes som informasjonskapsel (cookie) i hodet på HTTP-responsen tilbake til A

Teknologi: Vi har i undervisningen brukt CGI med shell-skript (pedagogiske grunner). Normalt sett brukes ikke dette. Mer utbredt er f.eks. Node, Java, PHP, etc.

Eksempel (pseudokode/CGI-shell):

#!/bin/sh

# Les XML-dokumentet fra STDIN
XML=$(head -c "$CONTENT_LENGTH")

# Plukk ut id og passord fra XML
ID=$(echo "$XML" | xmllint --xpath "/bruker/id/text()" -)
PW=$(echo "$XML" | xmllint --xpath "/bruker/passord/text()" -)

# Hash passordet
HASH=$(echo -n "$PW" | sha256sum | cut -d' ' -f1)

# Sjekk mot database
STORED_HASH=$(echo "SELECT passord FROM brukere WHERE id='$ID'" | sqlite3 db.db)

if [ "$HASH" = "$STORED_HASH" ]; then
    # Generer sesjonsID
    SESJON_ID=$(uuidgen)
    
    # Lagre sesjonsID i database
    echo "INSERT INTO sesjoner VALUES ('$SESJON_ID','$ID')" | sqlite3 db.db
    
    # Send cookie til klient
    echo "Set-Cookie: sesjonsid=$SESJON_ID; Path=/; HttpOnly"
    echo "Content-type: text/plain"
    echo
    echo "Innlogget"
else
    echo "Content-type: text/plain"
    echo
    echo "Feil brukernavn eller passord"
fi

Oppgave 5 - Autentisert sesjon 20%

Etter vellykket autentisering gis den autentiserte tilgang til database-innhold via et REST-API. Forklar og vis med et eksempel hvordan teknologi både hos A og B sørger for at påfølgende kommunikasjon gjøres i en autentisert sesjon – til tross for at kommunikasjonen går over HTTP/HTTPS (som er tilstandsløs og dermed ikke har innebygd støtte for sesjoner).

✅ Sensorveiledning

Etter vellykket autentisering er det produsert en sesjonsidentifikator som skal brukes av klienten i påfølgende HTTP-forespørsler for å angi at de tilhører en pågående og autentisert sesjon.

Fra server til klient (ved innlogging):

Dette gjøres ved en linje i HTTP-responsens hode som i eksemplet under:

Set-Cookie: sesjonsid=asdflkjsdlfjksldkfj;

Fra klient til server (påfølgende requests):

I HTTP-forespørsler fra klienten, som hører til sesjonen, legges en linje i hodet:

Cookie: sesjonsid=asdflkjsdlfjksldkfj;

Lagring:

Både klienten og tjeneren må lagre sesjonsidentifikatoren:

Tjeneren lagrer den sammen med sesjonens tilstandsinformasjon og evt. utløpstid
Klienten lagrer den sammen med tjenerens adresse og evt. utløpstid

Viktig: Tilstanden håndteres altså på applikasjonslaget (og ikke på transportlaget hvor HTTP/HTTPS virker).

Oppgave 6 - Same Origin Policy 5%

I forbindelse med web-applikasjoner, brukes retningslinjen for samme opphav (same origin policy).

Forklar/vis hva som menes med denne retningslinjen, og
forklar (1) hvordan og (2) hvor denne retningslinjen blir håndhevet.

✅ Sensorveiledning

Hva er Same Origin Policy?

Retningslinjen går ut på at nettlesere (web browsers) i utgangspunktet begrenser mulighetene for skript å kommunisere med fremmed kode – webtjenester/-tjenere som har et annet opphav (origin) enn skriptet selv.

Opphav bestemmes av:

Protokoll/skjema (f.eks. http)
Verten (f.eks. debbie.usn.no)
Porten (f.eks. 80)

Hvor og hvordan håndheves det?

Dette håndheves i rådende nettlesere, ved at kommunikasjon med fremmed kode kun tillates i visse tilfeller/unntak, som kan bestemmes/settes av utviklerne.

CORS (Cross-Origin Resource Sharing):

I emnet har vi sett på eksempler/oppgaver hvor vi har brukt mekanismen Cross-origin resource sharing (CORS), for å lage slike unntak. I CORS gir den fremmede tjeneren nettleseren tillatelser (av typen Access-Control-*).

Oppgave 7 - Virtualisering 20%

I linux-kjernen finnes flere mekanismer som brukes for å få til virtualisering på operativsystemnivå (ofte kalt konteinere). Nevn disse og forklar hvordan de bidrar til virtualiseringen.

Forklar hvordan bruk av virtualisering på operativsystemnivå kan øke sikkerheten i en web-tjeneste.

✅ Sensorveiledning - Mekanismer

To hovedmekanismer for virtualisering på operativsystemnivå i Linux-kjernen:

1. Namespaces:

Denne mekanismen lar en prosess oppleve en isolert og begrenset versjon av systemressursene som den kan bruke. Dette inkluderer blant annet:

Isolering av nettverksstacken
Isolering av filsystemet
Isolering av bruker-ID-er

2. Control Groups (cgroups):

Denne mekanismen lar en administrator begrense ressursbruken til en gruppe prosesser. Dette kan inkludere ressurser som:

Minne
CPU
Disk-I/O
Nettverksbåndbredde

✅ Økt sikkerhet

1. Isolasjon:

Ved å kjøre hver web-tjeneste i sin egen virtuelle maskin eller konteiner, kan man sikre at en eventuell kompromittering av en tjeneste ikke påvirker andre tjenester. Dette kan hindre en angriper fra å spre seg til andre deler av systemet.

2. Ressursbegrensning:

Ved å bruke cgroups kan man begrense mengden ressurser som en tjeneste kan bruke. Dette kan forhindre at en tjeneste bruker opp alle systemressursene og dermed gjør systemet utilgjengelig for andre tjenester eller brukere.

3. Redusert angrepsflate:

Mange tjenester på web er organisert ved hjelp av mikrotjenester, der flere uavhengige enkelt-tjenester fungerer sammen i et større system. Siden disse enkelt-tjenestene får en veldig begrenset oppgave, er veldig mye av det som følger med i en standard operativsystem-distribusjon unødvendig.

Konteinere er velegnet til å sette opp et strippet kjøremiljø, med kun nødvendig funksjonalitet. Jo mindre kodemengde/kompleksitet, desto færre feil/bugs/sårbarheter – og dermed bedre sikkerhet.

📝 TSD3060 Eksamen 2022-2023

ℹ️ Om denne eksamenen

✅ Sensorveiledning - Overordnet forklaring

✅ Linje-for-linje forklaring

✅ Sensorveiledning

✅ Sensorveiledning

✅ Sensorveiledning

✅ Sensorveiledning

✅ Sensorveiledning

✅ Sensorveiledning - Mekanismer

✅ Økt sikkerhet