Just my 2 cents:
Wenn man mit Schoepsen hantiert, sollte auch die nachfolgende Signalkette entsprechend sein und man damit umgehen können, sonst tuuuut es auch ein C2.
Im Ernst!
Wenn Du Dich, laut eigener Aussage, dem Thema Ton-Aufnahme erst einmal näherst, würde ich mir an Deiner Stelle sehr genau überlegen, wofür ich wieviel Geld ausgebe und was Du erreichen möchtest.
Wenn Du Zugriff auf einen Zoom H5 hast, ist das ein guter Startpunkt.
Die mitgelieferten Mikrofone sind nicht das Maß der Dinge, aber auch nicht schlecht; sprich, für den Einstieg ausreichend!
Das mitgelieferte XY Mikrofon-System ermöglicht Dir Dich dem Thema Ton-Aufnahme einfach zu nähern. Es ist flexibel und recht universell einsetzbar.
Damit kannst Du sicherlich auch ganz brauchbare Foley-Aufnahmen machen.
Bei ganz leisen Geräuschen wird es eventuell knifflig, aber konzentrieren wir uns erst einmal auf die 90% der Anwendungsfälle, den Rest klären wir später. (Denn Akustik und Tonaufnahmen sind komplex UND kompliziert.

Es gibt Studiengänge dazu!)
Über die beiden weiteren XLR-Mikrofon- bzw. Line-Eingänge kannst Du ein richtig vielseitiges Aufnahme System realisieren. Schließ noch zwei weitere Mikrofone an und schon kannst Du noch mehr aufnehmen.
Wenn Du zusätzliche Stereo-Aufnahmen machen möchtest, dann sollten es möglichst identische Mikrofone sein, mindestens dasselbe Modell desselben Herstellers.
Für den Einstieg ist das H5 mehr als gut und flexibel genug, um Dich ein gutes Stück Deines Weges zu begleiten.
Davon unberührt ist die Empfehlung eines MK4 und eines EVO 4 für Sprachaufnahmen.
Dieses Setup empfinde ich als eine gute und einfache Möglichkeit in das Thema Sprachaufnahmen einzusteigen. Es ist robust, vielseitig und wirklich einfach zu bedienen.
Was der freundliche Kollege
@soundjob mit den "Schoepsen" meint, ist völlig richtig und korrekt. Nur, wenn Du zwei Schoepse mit Nierencharakteristik einsetzen willst, solltest Du zumindest ein bißchen mehr Erfahrung besitzen, als aktuell.
Schoeps Mikrofone gehören zu den besten Mikrofonen auf der Welt und sind das "andere Ende" Deiner derzeitigen Anforderungen.
Schoepse sind großartiges Gear, aber dann geht es schon los: Du solltest dann auch zumindest gute Mikrofonkabel haben, zwei entsprechend gute Mikrofon-Vorverstärker und/oder ein vergleichbar hochwertiges Aufnahmegerät.
Dazu gehört das H5 leider nicht.

Selbst wenn Du die Schoepse wirklich billig bekommst, dann sind das mind. 2.000 € für die Mikrofone und für die Vorverstärker kannst Du rund dasselbe drauf rechnen und dann noch mal mind. 1.000 € für ein entsprechendes Aufnahmegerät, falls Du mobil Aufnahmen möchtest. Da sind die Kosten für die Kabel, Windschutze, Mikrofonhalterungen usw, usw im Bereich des größeren Rundungsfehlers.
Also, Du möchtest in das Thema Tonaufnahmen einsteigen? - SUPER!

Ich verspreche Dir eine spannende, faszinierende und langjährige "Reise".
Für einen Anfang bist Du mit dem Zoom H5 solide ausgestattet. Ich würde noch 10 € für einen zusätzlichen Windschutz ausgeben und dann raus und auf "Record" drücken!
Wenn Du zusätzlich noch gute Sprachaufnahmen machen möchtest, würde ich Dir das MK4 und EVO 4 empfehlen. Das ist eine gut funktionierende Kombination und auch für die Aufnahme von Geräuschen geeignet. Ob Du das MK4 auch Outdoor einsetzt, ist Deine Entscheidung. Ich sach nur "Die Kondensatoren in den Kondensatormikrofonen und kleinste Wassertröpfchen (z.B.: höhere Luftfeuchtigkeit) sind KEINE Freunde." Es kann passieren, daß Dein MK4 dann ernsten Schaden nimmt oder auch irreparabel beschädigt wird. Also ... VORSICHT!
Aber Indoor mit dem MK4 Foley-Aufnahmen zu machen ist eine gute Wahl! Wenn Du "nur" ein MK4 hast, sind es halt maximal Mono-Aufnahmen. Je nach Anforderung und Geräusch kann das ausreichen. Am besten - Testen!
Was Du aber immer beachten solltest, ist die
Qualität des aufgenommenen Signals.
Es nützt Dir das beste Gear NICHTS, wenn Du etwas (z.B:: Sprache) aufnimmst und es hallt wie im Bahnhof, (der pöhse, pöhse Raumhall ...

), im Hintergrund quatscht Dir jemand in die Aufnahme oder ein Auto mit "Bumm-Bumm-Musik" fährt vorbei, ... dann war alles für den Eimer.
Wenn Du all diese ganzen Umstände und Begleiterscheinungen unter Kontrolle und ein gerütteltes Maß Erfahrung, immer noch Bock und das entsprechende Budget hast, dann, ja dann sind "Schoepse" eine gute Wahl. Keine Frage.
Also immer hübsch einen Schritt nach dem anderen, sonst ... dicke Nase.
... und wenn Du dann noch "mehr" willst, also in den Bereich "3D Audio" und "Ambisonic" einsteigen möchtest, frag mich gerne.

Das ist noch sehr viel spannender als schon Stereo, aber ... offen gesagt, das ist für den Einstieg schon eine echte Herausforderung.
Wenn Dir "korreliert", "unkorreliert", "MS-Dematrizierung" nichts sagt und Dir der Unterschied zwischen einer "Hyper-" und einer "Superniere" noch nicht so ganz geläufig ist, dann solltest Du noch mehr Erfahrungen sammeln.
