Γενικη συζητηση για επεξεργαστες

**MNP-10** · 16-03-21, 14:57

Αρχικό μήνυμα από minas

Αν συζητάμε για ARM για servers, υπάρχουν άλλοι που έχουν προβάδισμα, πχ η Amazon:
https://www.anandtech.com/show/15578...-intel-and-amd
Θέλει πολύ δουλειά για να πας από τον καλό επεξεργαστή σε πλήρη πλατφόρμα και δεν νομίζω ότι η Apple έχει βλέψεις (ακόμα) για αυτή την αγορά.

Το μεγάλο βαρίδι των x86 είναι η προς τα πίσω συμβατότητα. Η Apple το έχει ξεφορτωθεί φτιάχνοντας νέα πλατφόρμα, αλλά όπως και με τη μετάβαση PPC -> Intel έχει τεράστια δουλειά να κάνει με το λογισμικό. Προφανώς μπορεί να τα καταφέρει, λόγω του κλειστού οικοσυστήματος, αλλά για τους άλλους δεν υπάρχει τέτοια επιλογή.

Το κυριο ειναι να εχεις το τσιπακι... απαξ και το χεις, τα περιφερειακα οπως τα server mobo ειναι ευκολη υποθεση. Και σαν υποστηριξη πλατφορμας, μιλαμε παντα για ARM instructions, οπότε αυτη ειναι δεδομενη.

Το ερωτημα ειναι αν η apple εχει ή δεν εχει βλεψεις γι'αυτην την αγορα. Αλλα στο υποθετικο ΝΑΙ οπου εχει, amd/intel εχουν χασει τ'αντερα τους γιατι δε μπορουν να ανταγωνιστουν.

Η amazon με το graviton2 και συντομα 3, εχει βρει μια cost effective και power efficient λυση απ'τις σαβουρες των amd/intel αλλα αυτο το κανει με πολυ πιο μικρα IPC σε σχεση με τα τσιπακια της apple. Αυτη που ηθελε να κανει κατι αντιστοιχο με την apple ηταν η nuvia... σε στυλ θα βγαλουμε arm παρομοιο με το apple και θα το πλασαρουμε στο server space... τους εξαγορασε η qualcomm...

- - - Updated - - -

Αρχικό μήνυμα από BlueChris

Συζητάτε για server farms Κλπ από μια εταιρεία που στους προσωπικούς υπολογιστές έχει διείσδυση 14% μετά από 30 χρόνια επανάστασης και Innovation... οτι νάναι.

Σκεψου το εξης... Η nuvia, που

α) δεν εχει καν διεισδυση σε οτιδηποτε, με κατι powerpoints που ελεγαν οτι πρεπει να κανουμε το server space efficient με οδηγο τα arm της apple, γιατι τα rack servers ειναι power constrained γυρω στα 300watt - αρα μονοδρομα η αποδοση βγαινει με πιο power efficient chipακια,

β) δεν εχει ουτε καν ετοιμο τσιπ για να δειξει οπως η apple

...αγοραστηκε για 1.4 δις $$$. Επειδη απλα ειπε οτι πρεπει να φτιαξουμε ενα design σα το apple και να το βαλουμε στους server. Φαντασου.

**netlag** · 16-03-21, 15:01

Αρχικό μήνυμα από MNP-10

Η amazon με το graviton2 και συντομα 3, εχει βρει μια cost effective και power efficient λυση απ'τις σαβουρες των amd/intel αλλα αυτο το κανει με πολυ πιο μικρα IPC σε σχεση με τα τσιπακια της apple. Αυτη που ηθελε να κανει κατι αντιστοιχο με την apple ηταν η nuvia... σε στυλ θα βγαλουμε arm παρομοιο με το apple και θα το πλασαρουμε στο server space... τους εξαγορασε νομιζω η qualcomm...

Εγώ νόμιζα τόσο καιρό ότι τα chip της Apple δεν είναι κάτι απίστευτα πιο εξωτικό από τα latest and greatest ARM designs. Αυτό που απλά της έδινε τόσο καλύτερες επιδόσεις ήταν ότι : Πλήρωνε αδρά για bleeding edge node. Και φόρτωνε τα chip της με πολύ μεγαλύτερο αριθμό transistor.

Αυτό το έκανε γιατι έχοντας το market share που έχει σε κινητά και tablet των 1000 και βάλε δολλαρίων την παίρνει.

Δηλαδή το IPC της ειναι υψηλό γιατί έχει μεγάλο transistor budget. Όχι γιατί έμαθε να φτιάχνει επεξεργαστές καλύτερα από όλους τους άλλους.

**minas** · 16-03-21, 17:24

Αρχικό μήνυμα από netlag

Εγώ νόμιζα τόσο καιρό ότι τα chip της Apple δεν είναι κάτι απίστευτα πιο εξωτικό από τα latest and greatest ARM designs. Αυτό που απλά της έδινε τόσο καλύτερες επιδόσεις ήταν ότι : Πλήρωνε αδρά για bleeding edge node. Και φόρτωνε τα chip της με πολύ μεγαλύτερο αριθμό transistor.

Αυτό το έκανε γιατι έχοντας το market share που έχει σε κινητά και tablet των 1000 και βάλε δολλαρίων την παίρνει.

Δηλαδή το IPC της ειναι υψηλό γιατί έχει μεγάλο transistor budget. Όχι γιατί έμαθε να φτιάχνει επεξεργαστές καλύτερα από όλους τους άλλους.

Είναι λίγο κι από τα δύο. Εξαρτάται μεν από την ARM για γενική αρχιτεκτονική, αλλά βάζει αρκετή custom δουλειά στο SoC.
Σε κάθε δεδομένη στιγμή είναι 6+ μήνες μπροστά από τον αντίστοιχο Snapdragon, ανάλογα με ποιοι δείκτες σε ενδιαφέρουν.

Με PC είναι δύσκολο να γίνει τέτοια σύγκριση.

**MNP-10** · 16-03-21, 19:42

Αρχικό μήνυμα από netlag

Εγώ νόμιζα τόσο καιρό ότι τα chip της Apple δεν είναι κάτι απίστευτα πιο εξωτικό από τα latest and greatest ARM designs. Αυτό που απλά της έδινε τόσο καλύτερες επιδόσεις ήταν ότι : Πλήρωνε αδρά για bleeding edge node. Και φόρτωνε τα chip της με πολύ μεγαλύτερο αριθμό transistor.

Αυτό το έκανε γιατι έχοντας το market share που έχει σε κινητά και tablet των 1000 και βάλε δολλαρίων την παίρνει.

Δηλαδή το IPC της ειναι υψηλό γιατί έχει μεγάλο transistor budget. Όχι γιατί έμαθε να φτιάχνει επεξεργαστές καλύτερα από όλους τους άλλους.

Οχι, εχουν χαος στο ipc... πχ το a14 (περυσινο 5nm tsmc) σε σχεση με το snap 888 (φετινο 5nm samsung), το apple εχει 1600 geekbench single και το samsung εχει 1100.... Στο δε multi το 888 χανει με 3700 vs 3800-4300 το apple, με τη διαφορα οτι το apple ειναι ...6core αντι 8core.

Και αυτο το χαος δεν ειναι μονο vs qualcomm, ειναι vs all... πχ τα χ86 αντε να βαρανε 4-5, αντε 6 (σε μικρα instructions και ηδη cached στην μop cache) instructions per second σε optimal conditions... το a14 επεξεργαζεται μεχρι 8 εντολες στον ιδιο κυκλο.

Το δε process advantage η apple το εχει ακομα και στο ιδιο process... δλδ στο 7nm tsmc, η apple εβαζε πολυ περισσοτερα τρανζιστορ ανα τετραγωνικο χιλιοστο απ'τους αντιπαλους της. Πχ τα amd chiplet σε zen2/3 εχουν 50εκ τρανζιστορ ανα mm2, τα gpu των 7nm της amd γυρω στα 40-42... μονο το renoir ειχε κοντα στα 65εκ τρανζιστορ ανα mm2, ενω το apple ηταν σχεδον στα 90εκ ανα mm2. Στα ιδια νανομετρα αλλά με low power design.

Εντωμεταξυ: https://www.gizchina.com/2021/02/16/...-has-appeared/

**konig** · 16-03-21, 21:21

Αρχικό μήνυμα από MNP-10

Το κυριο ειναι να εχεις το τσιπακι... απαξ και το χεις, τα περιφερειακα οπως τα server mobo ειναι ευκολη υποθεση. Και σαν υποστηριξη πλατφορμας, μιλαμε παντα για ARM instructions, οπότε αυτη ειναι δεδομενη.

Το ερωτημα ειναι αν η apple εχει ή δεν εχει βλεψεις γι'αυτην την αγορα. Αλλα στο υποθετικο ΝΑΙ οπου εχει, amd/intel εχουν χασει τ'αντερα τους γιατι δε μπορουν να ανταγωνιστουν.

Η amazon με το graviton2 και συντομα 3, εχει βρει μια cost effective και power efficient λυση απ'τις σαβουρες των amd/intel αλλα αυτο το κανει με πολυ πιο μικρα IPC σε σχεση με τα τσιπακια της apple. Αυτη που ηθελε να κανει κατι αντιστοιχο με την apple ηταν η nuvia... σε στυλ θα βγαλουμε arm παρομοιο με το apple και θα το πλασαρουμε στο server space... τους εξαγορασε η qualcomm...

- - - Updated - - -

Σκεψου το εξης... Η nuvia, που

α) δεν εχει καν διεισδυση σε οτιδηποτε, με κατι powerpoints που ελεγαν οτι πρεπει να κανουμε το server space efficient με οδηγο τα arm της apple, γιατι τα rack servers ειναι power constrained γυρω στα 300watt - αρα μονοδρομα η αποδοση βγαινει με πιο power efficient chipακια,

β) δεν εχει ουτε καν ετοιμο τσιπ για να δειξει οπως η apple

...αγοραστηκε για 1.4 δις $$$. Επειδη απλα ειπε οτι πρεπει να φτιαξουμε ενα design σα το apple και να το βαλουμε στους server. Φαντασου.

η nuvia αγοραστηκε για αλλους λογους και το ξερεις καλα

**netlag** · 17-03-21, 00:23

Αρχικό μήνυμα από MNP-10

Οχι, εχουν χαος στο ipc... πχ το a14 (περυσινο 5nm tsmc) σε σχεση με το snap 888 (φετινο 5nm samsung), το apple εχει 1600 geekbench single και το samsung εχει 1100.... Στο δε multi το 888 χανει με 3700 vs 3800-4300 το apple, με τη διαφορα οτι το apple ειναι ...6core αντι 8core.

Και αυτο το χαος δεν ειναι μονο vs qualcomm, ειναι vs all... πχ τα χ86 αντε να βαρανε 4-5, αντε 6 (σε μικρα instructions και ηδη cached στην μop cache) instructions per second σε optimal conditions... το a14 επεξεργαζεται μεχρι 8 εντολες στον ιδιο κυκλο.

Το δε process advantage η apple το εχει ακομα και στο ιδιο process... δλδ στο 7nm tsmc, η apple εβαζε πολυ περισσοτερα τρανζιστορ ανα τετραγωνικο χιλιοστο απ'τους αντιπαλους της. Πχ τα amd chiplet σε zen2/3 εχουν 50εκ τρανζιστορ ανα mm2, τα gpu των 7nm της amd γυρω στα 40-42... μονο το renoir ειχε κοντα στα 65εκ τρανζιστορ ανα mm2, ενω το apple ηταν σχεδον στα 90εκ ανα mm2. Στα ιδια νανομετρα αλλά με low power design.

Εντωμεταξυ: https://www.gizchina.com/2021/02/16/...-has-appeared/

σέβομαι το geekbench επειδή ειναι cross-platform αλλα με προβληματίζει οτι εχει γινει το bench who rules all other benches και το γεγονος οτι ειναι closed source. Επηρεάζει τα sales παγκοσμίως το geekbench. Δεν ξέρω δηλαδη αν εχει bias, και δεν θα το μάθουμε και ποτε.

Οσον αφορα το density στο ιδιο node να ρωτήσω κάτι γιατί δεν το ξέρω. Υψηλότερο density μηοως σημαίνει χαμηλότερα yields. Μήπως παει στα σκουπίδια περισσότερο silicon; Η Apple δεν δυσκολεύεται να επωμιστει το κοστος γιατι δεν πουλαει επεξεργαστες, πουλάει ολόκληρες συσκευες με premium price tags. Η qualcomm ομως και η amd πουλανε τσιπάκια. Εχουν tiers, και γενικότερα πανε μα βρουνε το πιο cost effective scenario για τα προϊόντα τους. Οι μεν εχουν πολλες προϋποθέσεις κόστους κερδους να καλύψουν, η Apple καθε χρονο φτιαχνει chipακια τα οποια ειναι χωρις περιορισμούς τέτοιους.

Πολύ καλά κάνει η Apple και τα chipακια της απο τοτε που πηγε σε Arm_8 ειναι παντα 6+ μηνες μπροστα οπως ειπε και ο minas. Αλλά τα chipακια αυτα δεν εχουν κανενα ανταγωνισμό αφου πάνε πακετo με ολοκληρα μηχανηματα και δεν πωλούνται solo.

**minas** · 17-03-21, 00:24

Αρχικό μήνυμα από minas

Είναι λίγο κι από τα δύο. Εξαρτάται μεν από την ARM για γενική αρχιτεκτονική, αλλά βάζει αρκετή custom δουλειά στο SoC.
Σε κάθε δεδομένη στιγμή είναι 6+ μήνες μπροστά από τον αντίστοιχο Snapdragon, ανάλογα με ποιοι δείκτες σε ενδιαφέρουν.

Με PC είναι δύσκολο να γίνει τέτοια σύγκριση.

Αρχικό μήνυμα από MNP-10

Οχι, εχουν χαος στο ipc... πχ το a14 (περυσινο 5nm tsmc) σε σχεση με το snap 888 (φετινο 5nm samsung), το apple εχει 1600 geekbench single και το samsung εχει 1100.... Στο δε multi το 888 χανει με 3700 vs 3800-4300 το apple, με τη διαφορα οτι το apple ειναι ...6core αντι 8core.

Και αυτο το χαος δεν ειναι μονο vs qualcomm, ειναι vs all... πχ τα χ86 αντε να βαρανε 4-5, αντε 6 (σε μικρα instructions και ηδη cached στην μop cache) instructions per second σε optimal conditions... το a14 επεξεργαζεται μεχρι 8 εντολες στον ιδιο κυκλο.

Το δε process advantage η apple το εχει ακομα και στο ιδιο process... δλδ στο 7nm tsmc, η apple εβαζε πολυ περισσοτερα τρανζιστορ ανα τετραγωνικο χιλιοστο απ'τους αντιπαλους της. Πχ τα amd chiplet σε zen2/3 εχουν 50εκ τρανζιστορ ανα mm2, τα gpu των 7nm της amd γυρω στα 40-42... μονο το renoir ειχε κοντα στα 65εκ τρανζιστορ ανα mm2, ενω το apple ηταν σχεδον στα 90εκ ανα mm2. Στα ιδια νανομετρα αλλά με low power design.

Εντωμεταξυ: https://www.gizchina.com/2021/02/16/...-has-appeared/

Και μετά έχουμε και την παραπάνω σύγκριση, με όλους τους δείκτες που ευνοούν την Apple

@MNP-10 δεν χρειάζεται να απαντήσεις σοβαρά, πλάκα κάνω.

**netlag** · 17-03-21, 00:30

Να προσθέσω κιόλας ότι τα benchακια μου αρέσουν πολύ αλλά ειδικά τα bench passively cooled συσκευών μπορουν πολύ ευκολα να τρολαριστουν. Και δεν μιλαω για δολο απο την εταιρεια που εφτιαξε το bench. Ουτε για δολο απο την εταιρεία που εφτιαξε τη συσκευή. Μιλαω αποκλειστικά για το σύστημα ψυξης. Δηλαδή στα scores της συγκρισης Α14 με S888 η ψυξη εχει παιξει μεγάλο ρολο.

Και τελος ειναι και το θεμα synthetic bench. Δηλαδη το νουμερο του geekbench δεν μπορει να γινει interpret σε real life performance. Γιατι τρεχει δεκαδες διαφορετικούς αλγοριθμους με άλλα weights στο score κλπ.

Και κάτι άσχετο με τη κουβέντα. Το a14 μπορει να ειναι πιο γρήγορο και απο τον Ryzen 3600 μου. Στο ios αυτη η δύναμη πως θα αξιοποιηθεί; Δηλαδή, μιλάμε για τσιπάκια με μεγαλο potential αλλα ειναι handicapped απο τα αποδυτήρια (OS).

Αυτο το handicap στο Mac OS δεν υφίσταται μεν οσον αφορα τα Μ chip. Αλλα και παλι ειναι Macintosh only. Ουτε Windows θα δουν ουτε linux ουτε τιποτα. Και bootloader να ξεκλειδωνε, η apple δεν θα εδινε ποτε driver support.

Με λίγα λόγια θεωρώ λάθος τη σύγκριση των apple επεξεργαστών με οποιοσδήποτε αλλους επεξεργαστές. Γιατί ειναι προϊόντα που δεν υπάρχουν μόνα τους στην αγορά. Και ειναι προϊόντα που σου επιβάλλουν με τι λειτουργικό θα τα τρέξεις.

**MNP-10** · 19-03-21, 00:09

Αρχικό μήνυμα από netlag

σέβομαι το geekbench επειδή ειναι cross-platform αλλα με προβληματίζει οτι εχει γινει το bench who rules all other benches και το γεγονος οτι ειναι closed source. Επηρεάζει τα sales παγκοσμίως το geekbench. Δεν ξέρω δηλαδη αν εχει bias, και δεν θα το μάθουμε και ποτε.

Τρεχει διαφορα cpu (pure) + cpu (ram/cache) workloads και απλα βγαινει μια σουμα. Το ιδανικο ειναι να εχεις τσεκαρει 100αδες workloads και να βγαλεις ενα sum, οπως κανει το phoronix πχ, αλλα οκ, και 10-15 τεστ να κανει σε διαφορετικα workloads οκ ειναι. Πριν βγει το geekbench και γινει διαδεδομενο εγω χρησιμοποιουσα ενα σκριπτ στο linux που εκανε κατι παρομοιο... λιγο compress, λιγο decompress, λιγο μετατροπες αρχειων ηχου/βιντεο, λιγο encryption/decryption, λιγο rendering, κτλ... και ειχα ενα σκορ ανα task και ενα σκορ τελικο. Ειναι οτι πιο αντιπροσωπευτικο υπαρχει σε σχεση με το να τρεχεις ...το cinebench.

Οσον αφορα το density στο ιδιο node να ρωτήσω κάτι γιατί δεν το ξέρω. Υψηλότερο density μηοως σημαίνει χαμηλότερα yields. Μήπως παει στα σκουπίδια περισσότερο silicon;

Το αναποδο. Οσο περισσοτερα τρανζιστορ ανα mm2, τοσα λιγοτερα mm2 χρειαζεσαι, τοσα λιγοτερα defects βγαινουν ανα τσιπακι.

Πολύ καλά κάνει η Apple και τα chipακια της απο τοτε που πηγε σε Arm_8 ειναι παντα 6+ μηνες μπροστα οπως ειπε και ο minas. Αλλά τα chipακια αυτα δεν εχουν κανενα ανταγωνισμό αφου πάνε πακετo με ολοκληρα μηχανηματα και δεν πωλούνται solo.

Ναι απο επιλογη ειναι αυτο. Αν επιλεξει διαφορετικη κατευθυνση, τους εκλεισε το σπιτι στα χ86.

- - - Updated - - -

Αρχικό μήνυμα από netlag

Να προσθέσω κιόλας ότι τα benchακια μου αρέσουν πολύ αλλά ειδικά τα bench passively cooled συσκευών μπορουν πολύ ευκολα να τρολαριστουν. Και δεν μιλαω για δολο απο την εταιρεια που εφτιαξε το bench. Ουτε για δολο απο την εταιρεία που εφτιαξε τη συσκευή. Μιλαω αποκλειστικά για το σύστημα ψυξης. Δηλαδή στα scores της συγκρισης Α14 με S888 η ψυξη εχει παιξει μεγάλο ρολο.

Κοιτα, αν κοιτας την αρχιτεκτονικη δε σε πολυνοιαζει. Κοιτας το καλυτερο δυνατο αποτελεσμα πριν παιξει thermal throttling. Εκει βγαζεις το ipc.

Και τελος ειναι και το θεμα synthetic bench. Δηλαδη το νουμερο του geekbench δεν μπορει να γινει interpret σε real life performance. Γιατι τρεχει δεκαδες διαφορετικούς αλγοριθμους με άλλα weights στο score κλπ.

Στην ερωτηση αν ο Χ επεξεργαστης ειναι γρηγορος, η απαντηση ειναι παντα "σε τι πραγμα ειναι γρηγορος?"... ε οσο το δυνατον περισσοτερα πραγματα τρεχεις, τοσο πιο πολυ μπορεις να καλυψεις μια "γενικη" απαντηση στη γενικευση αν ο Χ επεξεργαστης ειναι ...γενικα γρηγορος. Δεν υπαρχει αλλος τροπος βασικα.

Και κάτι άσχετο με τη κουβέντα. Το a14 μπορει να ειναι πιο γρήγορο και απο τον Ryzen 3600 μου. Στο ios αυτη η δύναμη πως θα αξιοποιηθεί; Δηλαδή, μιλάμε για τσιπάκια με μεγαλο potential αλλα ειναι handicapped απο τα αποδυτήρια (OS).

Αυτο το handicap στο Mac OS δεν υφίσταται μεν οσον αφορα τα Μ chip. Αλλα και παλι ειναι Macintosh only. Ουτε Windows θα δουν ουτε linux ουτε τιποτα. Και bootloader να ξεκλειδωνε, η apple δεν θα εδινε ποτε driver support.

Με λίγα λόγια θεωρώ λάθος τη σύγκριση των apple επεξεργαστών με οποιοσδήποτε αλλους επεξεργαστές. Γιατί ειναι προϊόντα που δεν υπάρχουν μόνα τους στην αγορά. Και ειναι προϊόντα που σου επιβάλλουν με τι λειτουργικό θα τα τρέξεις.

Θεμα επιλογης ειναι αυτο. Δλδ δεν υπαρχει καποια ασυμβατοτητα στο να μη τρεξει πχ το apple στο linux αφου εχει arm instrucitons. Δλδ αν η apple θελει να δωσει πχ σε servers ή σε workstations με αλλα λειτουργικα, μπορει να το κανει. Το τονιζω οτι εναι θεμα επιλογης γιατι απ'την επιλογη αυτη κρινεται και το αν μπορει να παει πχ να κανει επεκταση στο server market τρεχοντας linux ή windows.

Επισης: https://arstechnica.com/gadgets/2021...d-you-can-too/

Πχ εχεις παρει ενα m1 mini nuc και μπορεις να το βαλεις να τρεχει linux. Αυτο ειναι κατι που δυνητικα θα μ'ενδιεφερε.

**netlag** · 19-03-21, 04:26

Αρχικό μήνυμα από MNP-10

Το αναποδο. Οσο περισσοτερα τρανζιστορ ανα mm2, τοσα λιγοτερα mm2 χρειαζεσαι, τοσα λιγοτερα defects βγαινουν ανα τσιπακι.

Ναι το ότι τοσα λιγότερα mm^2 χρειάζεσαι το ξέρω, εγω λεω οτι μήπως ανεβάζοντας τη πυκνότητα ανεβάζεις και τα defects μη γραμμικα. Το υψηλότερο density της apple της εξασφαλιζει πιο πολλα transistor ανά υγιές die, αλλα μηπως βγαζει περισσότερα defective dies από ότι αν ειχε χαμηλοτερο density?

Λογικα ο αριθμος των defects ειναι ανάλογος του αριθμο των τρανζίστορ σε ενα συγκεκριμένο density. Ομως δεν σημαινει οτι x density = y defects, ενώ 2x density = 2y defects. Θα μπορουσε να ειναι 2x density = 4y defects. Αν ανεβαίνουν μη γραμμικα, ειναι λογικο εταιρίες σαν την AMD που πουλανε τσιπακια να παιζουν σε μικροτερα densities.

- - - Updated - - -

Αρχικό μήνυμα από MNP-10

Πχ εχεις παρει ενα m1 mini nuc και μπορεις να το βαλεις να τρεχει linux. Αυτο ειναι κατι που δυνητικα θα μ'ενδιεφερε.

Ρε συ καταπληκτικό θα ηταν αυτο αν εδινε η Apple επίσημο suppprt. Αν γίνει απο community, φοβαμαι οτι ο M1 θα τρεχει crippled στο ubuntu.

- - - Updated - - -

Αρχικό μήνυμα από MNP-10

]
Κοιτα, αν κοιτας την αρχιτεκτονικη δε σε πολυνοιαζει. Κοιτας το καλυτερο δυνατο αποτελεσμα πριν παιξει thermal throttling. Εκει βγαζεις το ipc.

Το geekbench κραταει κανα διλεπτο σιγουρα. Βλεπουμε διάφορες μεταξυ κινητων με ιδιους επεξεργαστες, και αυτο λογικα ειναι θεμα throttling συχνοτητας.

Μπορεί να είναι λογω σχεδιασης του κινητού γενικότερα. Σχεδίασης της ψυξης. Μπορεί να ειναι λογω binning του ιδιου του chip (το ενα να παιζει με. λιγοτερο voltage απο το αλλο και να εχει καλύτερα thermals) κλπ.

Ισως απλά θα ηταν σωστότερο για τις συγκρισεις chip vs chip που κανουμε εμεις το καθε bench να δουλεύει για μερικα δευτερόλεπτα και οχι για λεπτά.

Για τις συγκρισεις κινητο vs κινητο, μια χαρα ειναι ετσι οπως είναι το geekbench.

- - - Updated - - -

τελοσπαντων σε καμια περίπτωση δεν αμφισβητώ τις δυνατότητες των chip της apple, ισα ισα. Απλά θεωρώ οτι ολοι οι αλλοι chipmakers κάνουν δεκαδες παραχωρήσεις ώστε να βγάλουν το πιο cost effective chip για να πουλησουν καλα και να κερδισουν περισσότερο. Ενώ η apple εχει τους μηχανικους της πιο ελευθερους, και oriented στο να φέρουν επιδόσεις. Ωστε μετά να πει στο πελάτη Apple που πληρωνει price premium, ότι παίρνει το πιο γρηγορο chip στο industry, και να ειναι αληθεια.

**MNP-10** · 21-03-21, 01:43

Αρχικό μήνυμα από netlag

Ναι το ότι τοσα λιγότερα mm^2 χρειάζεσαι το ξέρω, εγω λεω οτι μήπως ανεβάζοντας τη πυκνότητα ανεβάζεις και τα defects μη γραμμικα. Το υψηλότερο density της apple της εξασφαλιζει πιο πολλα transistor ανά υγιές die, αλλα μηπως βγαζει περισσότερα defective dies από ότι αν ειχε χαμηλοτερο density?

Λογικα ο αριθμος των defects ειναι ανάλογος του αριθμο των τρανζίστορ σε ενα συγκεκριμένο density. Ομως δεν σημαινει οτι x density = y defects, ενώ 2x density = 2y defects. Θα μπορουσε να ειναι 2x density = 4y defects. Αν ανεβαίνουν μη γραμμικα, ειναι λογικο εταιρίες σαν την AMD που πουλανε τσιπακια να παιζουν σε μικροτερα densities.

Το defect ειναι λογω σφαλματος στη λιθογραφια, δλδ δε "τυπωνεται" σωστα στο wafer αυτο που πρεπει να τυπωθει. Αυτα τα λιθογραφικα λαθη συμβαινουν ανεξαρτητα απ'το design που καλειται το μηχανημα να τυπωσει... Για καθε process node υπαρχει ενα συγκεκριμενο error ratio που θα εχει ολο το wafer, οτι και αν τυπωθει πανω στο wafer. Ξερεις δλδ εκ των προτερων οτι πανω στο wafer θα εχει πχ 1000 λαθη απλωμενα γυρω γυρω. Αυτα δε θα αυξηθουν αν εχεις παραπανω ή μικροτερο density στα τρανζιστορ... θα συμβουν ουτως ή αλλως. Αρα αφου θα συμβουν που θα συμβουν εχεις 2 λυσεις

1) fault tolerant design (δλδ σχεδια οπου ακομα και αν χαλασει κατι να μπορεις να το κανεις disable το κομματι εκεινο του τσιπ που χαλασε και να λειτουργει κατι αλλο παραλληλα, κανονικα).
2) πυκνο design για να ελαχιστοποιησεις τα mm2 και κατ'επεκταση τον αριθμο των προβληματικων chip per wafer.

**netlag** · 21-03-21, 01:58

μάλιστα thanx mnp-10. Πίστευα οτι απο επιλογη δεν εχει μεγαλο density η AMD αλλα μαλλον ειναι αδυναμία της

**MNP-10** · 21-03-21, 12:32

Συνηθως αυτο που επηρεαζει το density ως design choice ειναι το ποσο ρευμα θελουν να περναει απ'τα τρανζιστορ. Αν θελουν να περναει πολυ ρευμα, "απλωνουν" τα τρανζιστορ για να μη γινονται βραχυκυκλωματα. Οι cpu και gpu της amd που ρουφανε τρελο ρευμα ειναι "απλωμενες" γι'αυτο το λογο. Το πιο dense design τους ειναι ο renoir που θα πηγαινε για laptop και εχει χαμηλοτερα tdp. Τα mobile arm επειδη ειναι low power δεν εχουν τετοια θεματα οπότε ανεβαζουν πολυ τη πυκνοτητα. Ανεβαζοντας τη πυκνοτητα ομως χωρανε περισσοτερα τρανζιστορ και κατ'επεκταση ανεβαινουν οι επιδοσεις παρα το μικροτερο power που απαιτειται.

Χαμηλα volt / χαμηλα hz / χαμηλα watt / πυκνο τσιπ.

Ουσιαστικα το πυκνωμα του τσιπ, βαζοντας πχ +60-80-100% παραπανω τρανζιστορ μπορει να ισοφαρισει τα χαμηλα hz και τη χαμηλη καταναλωση. Κατεβαζεις πχ ενα τσιπακι που θα ετρεχε στα 5ghz, στα 3ghz, το κανεις massively parallel με τεραστιο out of order window οπως το apple που μπορει να εκτελει εντολες που βρισκονται 800 γραμμες μπροστα στη σειρα εκτελεσης (αντι 100-200-300 στα x86), βαζεις παραπανω integer/float/vector units για να κανουν και αυτα παραλληλη επεξεργασια, μεγαλωνεις τις L1 caches, και εχεις τα αποτελεσματα της apple. Αυτο ειναι ακομα πιο ευκολο σε gpu.

**Marios145** · 22-03-21, 02:36

Αρχικό μήνυμα από MNP-10

Ουσιαστικα το πυκνωμα του τσιπ, βαζοντας πχ +60-80-100% παραπανω τρανζιστορ μπορει να ισοφαρισει τα χαμηλα hz και τη χαμηλη καταναλωση. Κατεβαζεις πχ ενα τσιπακι που θα ετρεχε στα 5ghz, στα 3ghz, το κανεις massively parallel με τεραστιο out of order window οπως το apple που μπορει να εκτελει εντολες που βρισκονται 800 γραμμες μπροστα στη σειρα εκτελεσης (αντι 100-200-300 στα x86), βαζεις παραπανω integer/float/vector units για να κανουν και αυτα παραλληλη επεξεργασια, μεγαλωνεις τις L1 caches, και εχεις τα αποτελεσματα της apple. Αυτο ειναι ακομα πιο ευκολο σε gpu.

Και μετά ανοίγεις το υπερ-σύγχρονο πρόγραμμα ή παιχνιδι released in 2020 που τρέχει τα πάντα σε ενα thread με SSE2 και απορείς γιατί σέρνεται :P

**MNP-10** · 22-03-21, 11:40

Αρχικό μήνυμα από Marios145

Και μετά ανοίγεις το υπερ-σύγχρονο πρόγραμμα ή παιχνιδι released in 2020 που τρέχει τα πάντα σε ενα thread με SSE2 και απορείς γιατί σέρνεται :P

Ναι οταν ανεβαζεις cores χωρις να αλλαζεις το ipc, αυτο συμβαινει. Με τα παραπανω (μεγαλυτερο out of order window / more integer-float-vector units / μεγαλυτερες L1 caches) επιταχυνεται η εφαρμογη ακομα και με 1 thread γιατι ανεβαινει το ipc. Το apple πχ μπορει να εκτελεσει γυρω στις 7-8 εντολες ανα κυκλο σε σχεση με τις 4-5 των x86.

Ακομα και τα παλαια vector instructions μπορουν να πανε καλυτερα, αν πχ αντι για 2 vector units των 128 bit (SSE2), βαλεις ...4 ή 8 units... ετσι η cpu θα επεξεργαζεται 2-4πλασιο αριθμο SSE2 εντολων. Αντι να κανεις wider vectors απλα εκτελεις παραλληλα περισσοτερους "στενους" 128bitους. Εν μερει αυτο κανει και το apple. Αντι να παει wider στα 512 bit, απλα αυξησε τα vector units για να εκτελει περισσοτερες vector εντολες ταυτοχρονα. Δεν ειναι κακη προσεγγιση. Και η AMD πχ αν διπλασιασει τα avx2 units θα πιανει αποδοση avx512 των intel, χωρις να εχει βαλει καν avx512, και χρησιμοποιωντας το παλιο avx2 set που εχει μεγαλυτερη υποστηριξη.

Θέμα: Γενικη συζητηση για επεξεργαστες

Tags για αυτό το Θέμα

Bookmarks

Bookmarks

Δικαιώματα - Επιλογές