Το κυριο ειναι να εχεις το τσιπακι... απαξ και το χεις, τα περιφερειακα οπως τα server mobo ειναι ευκολη υποθεση. Και σαν υποστηριξη πλατφορμας, μιλαμε παντα για ARM instructions, οπότε αυτη ειναι δεδομενη.
Το ερωτημα ειναι αν η apple εχει ή δεν εχει βλεψεις γι'αυτην την αγορα. Αλλα στο υποθετικο ΝΑΙ οπου εχει, amd/intel εχουν χασει τ'αντερα τους γιατι δε μπορουν να ανταγωνιστουν.
Η amazon με το graviton2 και συντομα 3, εχει βρει μια cost effective και power efficient λυση απ'τις σαβουρες των amd/intel αλλα αυτο το κανει με πολυ πιο μικρα IPC σε σχεση με τα τσιπακια της apple. Αυτη που ηθελε να κανει κατι αντιστοιχο με την apple ηταν η nuvia... σε στυλ θα βγαλουμε arm παρομοιο με το apple και θα το πλασαρουμε στο server space... τους εξαγορασε η qualcomm...
- - - Updated - - -
Σκεψου το εξης... Η nuvia, που
α) δεν εχει καν διεισδυση σε οτιδηποτε, με κατι powerpoints που ελεγαν οτι πρεπει να κανουμε το server space efficient με οδηγο τα arm της apple, γιατι τα rack servers ειναι power constrained γυρω στα 300watt - αρα μονοδρομα η αποδοση βγαινει με πιο power efficient chipακια,
β) δεν εχει ουτε καν ετοιμο τσιπ για να δειξει οπως η apple
...αγοραστηκε για 1.4 δις $$$. Επειδη απλα ειπε οτι πρεπει να φτιαξουμε ενα design σα το apple και να το βαλουμε στους server. Φαντασου.
Εμφάνιση 346-360 από 484
-
16-03-21, 14:57 Απάντηση: Γενικη συζητηση για επεξεργαστες #346
-
16-03-21, 15:01 Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #347
Εγώ νόμιζα τόσο καιρό ότι τα chip της Apple δεν είναι κάτι απίστευτα πιο εξωτικό από τα latest and greatest ARM designs. Αυτό που απλά της έδινε τόσο καλύτερες επιδόσεις ήταν ότι : Πλήρωνε αδρά για bleeding edge node. Και φόρτωνε τα chip της με πολύ μεγαλύτερο αριθμό transistor.
Αυτό το έκανε γιατι έχοντας το market share που έχει σε κινητά και tablet των 1000 και βάλε δολλαρίων την παίρνει.
Δηλαδή το IPC της ειναι υψηλό γιατί έχει μεγάλο transistor budget. Όχι γιατί έμαθε να φτιάχνει επεξεργαστές καλύτερα από όλους τους άλλους.
Antec P280 | beQuiet S9-700 | Arctic Liquid Freezer II 240 | MSI X470 Gaming Pro Max | R9 5900X | 3600CL16 32GB | RTX3070 | XPG8200Pro | ROG PG258Q
-
16-03-21, 17:24 Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #348
Είναι λίγο κι από τα δύο. Εξαρτάται μεν από την ARM για γενική αρχιτεκτονική, αλλά βάζει αρκετή custom δουλειά στο SoC.
Σε κάθε δεδομένη στιγμή είναι 6+ μήνες μπροστά από τον αντίστοιχο Snapdragon, ανάλογα με ποιοι δείκτες σε ενδιαφέρουν.
Με PC είναι δύσκολο να γίνει τέτοια σύγκριση.
-
16-03-21, 19:42 Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #349
Οχι, εχουν χαος στο ipc... πχ το a14 (περυσινο 5nm tsmc) σε σχεση με το snap 888 (φετινο 5nm samsung), το apple εχει 1600 geekbench single και το samsung εχει 1100.... Στο δε multi το 888 χανει με 3700 vs 3800-4300 το apple, με τη διαφορα οτι το apple ειναι ...6core αντι 8core.
Και αυτο το χαος δεν ειναι μονο vs qualcomm, ειναι vs all... πχ τα χ86 αντε να βαρανε 4-5, αντε 6 (σε μικρα instructions και ηδη cached στην μop cache) instructions per second σε optimal conditions... το a14 επεξεργαζεται μεχρι 8 εντολες στον ιδιο κυκλο.
Το δε process advantage η apple το εχει ακομα και στο ιδιο process... δλδ στο 7nm tsmc, η apple εβαζε πολυ περισσοτερα τρανζιστορ ανα τετραγωνικο χιλιοστο απ'τους αντιπαλους της. Πχ τα amd chiplet σε zen2/3 εχουν 50εκ τρανζιστορ ανα mm2, τα gpu των 7nm της amd γυρω στα 40-42... μονο το renoir ειχε κοντα στα 65εκ τρανζιστορ ανα mm2, ενω το apple ηταν σχεδον στα 90εκ ανα mm2. Στα ιδια νανομετρα αλλά με low power design.
Εντωμεταξυ: https://www.gizchina.com/2021/02/16/...-has-appeared/Τελευταία επεξεργασία από το μέλος MNP-10 : 16-03-21 στις 19:47.
-
16-03-21, 21:21 Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #350
-
17-03-21, 00:23 Re: Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #351
σέβομαι το geekbench επειδή ειναι cross-platform αλλα με προβληματίζει οτι εχει γινει το bench who rules all other benches και το γεγονος οτι ειναι closed source. Επηρεάζει τα sales παγκοσμίως το geekbench. Δεν ξέρω δηλαδη αν εχει bias, και δεν θα το μάθουμε και ποτε.
Οσον αφορα το density στο ιδιο node να ρωτήσω κάτι γιατί δεν το ξέρω. Υψηλότερο density μηοως σημαίνει χαμηλότερα yields. Μήπως παει στα σκουπίδια περισσότερο silicon; Η Apple δεν δυσκολεύεται να επωμιστει το κοστος γιατι δεν πουλαει επεξεργαστες, πουλάει ολόκληρες συσκευες με premium price tags. Η qualcomm ομως και η amd πουλανε τσιπάκια. Εχουν tiers, και γενικότερα πανε μα βρουνε το πιο cost effective scenario για τα προϊόντα τους. Οι μεν εχουν πολλες προϋποθέσεις κόστους κερδους να καλύψουν, η Apple καθε χρονο φτιαχνει chipακια τα οποια ειναι χωρις περιορισμούς τέτοιους.
Πολύ καλά κάνει η Apple και τα chipακια της απο τοτε που πηγε σε Arm_8 ειναι παντα 6+ μηνες μπροστα οπως ειπε και ο minas. Αλλά τα chipακια αυτα δεν εχουν κανενα ανταγωνισμό αφου πάνε πακετo με ολοκληρα μηχανηματα και δεν πωλούνται solo.Τελευταία επεξεργασία από το μέλος netlag : 17-03-21 στις 00:35.
Antec P280 | beQuiet S9-700 | Arctic Liquid Freezer II 240 | MSI X470 Gaming Pro Max | R9 5900X | 3600CL16 32GB | RTX3070 | XPG8200Pro | ROG PG258Q
-
17-03-21, 00:24 Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #352
-
17-03-21, 00:30 Re: Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #353
Να προσθέσω κιόλας ότι τα benchακια μου αρέσουν πολύ αλλά ειδικά τα bench passively cooled συσκευών μπορουν πολύ ευκολα να τρολαριστουν. Και δεν μιλαω για δολο απο την εταιρεια που εφτιαξε το bench. Ουτε για δολο απο την εταιρεία που εφτιαξε τη συσκευή. Μιλαω αποκλειστικά για το σύστημα ψυξης. Δηλαδή στα scores της συγκρισης Α14 με S888 η ψυξη εχει παιξει μεγάλο ρολο.
Και τελος ειναι και το θεμα synthetic bench. Δηλαδη το νουμερο του geekbench δεν μπορει να γινει interpret σε real life performance. Γιατι τρεχει δεκαδες διαφορετικούς αλγοριθμους με άλλα weights στο score κλπ.
Και κάτι άσχετο με τη κουβέντα. Το a14 μπορει να ειναι πιο γρήγορο και απο τον Ryzen 3600 μου. Στο ios αυτη η δύναμη πως θα αξιοποιηθεί; Δηλαδή, μιλάμε για τσιπάκια με μεγαλο potential αλλα ειναι handicapped απο τα αποδυτήρια (OS).
Αυτο το handicap στο Mac OS δεν υφίσταται μεν οσον αφορα τα Μ chip. Αλλα και παλι ειναι Macintosh only. Ουτε Windows θα δουν ουτε linux ουτε τιποτα. Και bootloader να ξεκλειδωνε, η apple δεν θα εδινε ποτε driver support.
Με λίγα λόγια θεωρώ λάθος τη σύγκριση των apple επεξεργαστών με οποιοσδήποτε αλλους επεξεργαστές. Γιατί ειναι προϊόντα που δεν υπάρχουν μόνα τους στην αγορά. Και ειναι προϊόντα που σου επιβάλλουν με τι λειτουργικό θα τα τρέξεις.Τελευταία επεξεργασία από το μέλος netlag : 17-03-21 στις 00:50.
Antec P280 | beQuiet S9-700 | Arctic Liquid Freezer II 240 | MSI X470 Gaming Pro Max | R9 5900X | 3600CL16 32GB | RTX3070 | XPG8200Pro | ROG PG258Q
-
19-03-21, 00:09 Απάντηση: Re: Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #354
Τρεχει διαφορα cpu (pure) + cpu (ram/cache) workloads και απλα βγαινει μια σουμα. Το ιδανικο ειναι να εχεις τσεκαρει 100αδες workloads και να βγαλεις ενα sum, οπως κανει το phoronix πχ, αλλα οκ, και 10-15 τεστ να κανει σε διαφορετικα workloads οκ ειναι. Πριν βγει το geekbench και γινει διαδεδομενο εγω χρησιμοποιουσα ενα σκριπτ στο linux που εκανε κατι παρομοιο... λιγο compress, λιγο decompress, λιγο μετατροπες αρχειων ηχου/βιντεο, λιγο encryption/decryption, λιγο rendering, κτλ... και ειχα ενα σκορ ανα task και ενα σκορ τελικο. Ειναι οτι πιο αντιπροσωπευτικο υπαρχει σε σχεση με το να τρεχεις ...το cinebench.
Οσον αφορα το density στο ιδιο node να ρωτήσω κάτι γιατί δεν το ξέρω. Υψηλότερο density μηοως σημαίνει χαμηλότερα yields. Μήπως παει στα σκουπίδια περισσότερο silicon;
Πολύ καλά κάνει η Apple και τα chipακια της απο τοτε που πηγε σε Arm_8 ειναι παντα 6+ μηνες μπροστα οπως ειπε και ο minas. Αλλά τα chipακια αυτα δεν εχουν κανενα ανταγωνισμό αφου πάνε πακετo με ολοκληρα μηχανηματα και δεν πωλούνται solo.
- - - Updated - - -
Κοιτα, αν κοιτας την αρχιτεκτονικη δε σε πολυνοιαζει. Κοιτας το καλυτερο δυνατο αποτελεσμα πριν παιξει thermal throttling. Εκει βγαζεις το ipc.
Και τελος ειναι και το θεμα synthetic bench. Δηλαδη το νουμερο του geekbench δεν μπορει να γινει interpret σε real life performance. Γιατι τρεχει δεκαδες διαφορετικούς αλγοριθμους με άλλα weights στο score κλπ.
Και κάτι άσχετο με τη κουβέντα. Το a14 μπορει να ειναι πιο γρήγορο και απο τον Ryzen 3600 μου. Στο ios αυτη η δύναμη πως θα αξιοποιηθεί; Δηλαδή, μιλάμε για τσιπάκια με μεγαλο potential αλλα ειναι handicapped απο τα αποδυτήρια (OS).
Αυτο το handicap στο Mac OS δεν υφίσταται μεν οσον αφορα τα Μ chip. Αλλα και παλι ειναι Macintosh only. Ουτε Windows θα δουν ουτε linux ουτε τιποτα. Και bootloader να ξεκλειδωνε, η apple δεν θα εδινε ποτε driver support.
Με λίγα λόγια θεωρώ λάθος τη σύγκριση των apple επεξεργαστών με οποιοσδήποτε αλλους επεξεργαστές. Γιατί ειναι προϊόντα που δεν υπάρχουν μόνα τους στην αγορά. Και ειναι προϊόντα που σου επιβάλλουν με τι λειτουργικό θα τα τρέξεις.
Επισης: https://arstechnica.com/gadgets/2021...d-you-can-too/
Πχ εχεις παρει ενα m1 mini nuc και μπορεις να το βαλεις να τρεχει linux. Αυτο ειναι κατι που δυνητικα θα μ'ενδιεφερε.
-
19-03-21, 04:26 Re: Απάντηση: Re: Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #355
Ναι το ότι τοσα λιγότερα mm^2 χρειάζεσαι το ξέρω, εγω λεω οτι μήπως ανεβάζοντας τη πυκνότητα ανεβάζεις και τα defects μη γραμμικα. Το υψηλότερο density της apple της εξασφαλιζει πιο πολλα transistor ανά υγιές die, αλλα μηπως βγαζει περισσότερα defective dies από ότι αν ειχε χαμηλοτερο density?
Λογικα ο αριθμος των defects ειναι ανάλογος του αριθμο των τρανζίστορ σε ενα συγκεκριμένο density. Ομως δεν σημαινει οτι x density = y defects, ενώ 2x density = 2y defects. Θα μπορουσε να ειναι 2x density = 4y defects. Αν ανεβαίνουν μη γραμμικα, ειναι λογικο εταιρίες σαν την AMD που πουλανε τσιπακια να παιζουν σε μικροτερα densities.
- - - Updated - - -
Ρε συ καταπληκτικό θα ηταν αυτο αν εδινε η Apple επίσημο suppprt. Αν γίνει απο community, φοβαμαι οτι ο M1 θα τρεχει crippled στο ubuntu.
- - - Updated - - -
Το geekbench κραταει κανα διλεπτο σιγουρα. Βλεπουμε διάφορες μεταξυ κινητων με ιδιους επεξεργαστες, και αυτο λογικα ειναι θεμα throttling συχνοτητας.
Μπορεί να είναι λογω σχεδιασης του κινητού γενικότερα. Σχεδίασης της ψυξης. Μπορεί να ειναι λογω binning του ιδιου του chip (το ενα να παιζει με. λιγοτερο voltage απο το αλλο και να εχει καλύτερα thermals) κλπ.
Ισως απλά θα ηταν σωστότερο για τις συγκρισεις chip vs chip που κανουμε εμεις το καθε bench να δουλεύει για μερικα δευτερόλεπτα και οχι για λεπτά.
Για τις συγκρισεις κινητο vs κινητο, μια χαρα ειναι ετσι οπως είναι το geekbench.
- - - Updated - - -
τελοσπαντων σε καμια περίπτωση δεν αμφισβητώ τις δυνατότητες των chip της apple, ισα ισα. Απλά θεωρώ οτι ολοι οι αλλοι chipmakers κάνουν δεκαδες παραχωρήσεις ώστε να βγάλουν το πιο cost effective chip για να πουλησουν καλα και να κερδισουν περισσότερο. Ενώ η apple εχει τους μηχανικους της πιο ελευθερους, και oriented στο να φέρουν επιδόσεις. Ωστε μετά να πει στο πελάτη Apple που πληρωνει price premium, ότι παίρνει το πιο γρηγορο chip στο industry, και να ειναι αληθεια.
Antec P280 | beQuiet S9-700 | Arctic Liquid Freezer II 240 | MSI X470 Gaming Pro Max | R9 5900X | 3600CL16 32GB | RTX3070 | XPG8200Pro | ROG PG258Q
-
21-03-21, 01:43 Απάντηση: Re: Απάντηση: Re: Απάντηση: Re: Απάντηση: Γενικη συζητηση για επεξεργαστες #356
Το defect ειναι λογω σφαλματος στη λιθογραφια, δλδ δε "τυπωνεται" σωστα στο wafer αυτο που πρεπει να τυπωθει. Αυτα τα λιθογραφικα λαθη συμβαινουν ανεξαρτητα απ'το design που καλειται το μηχανημα να τυπωσει... Για καθε process node υπαρχει ενα συγκεκριμενο error ratio που θα εχει ολο το wafer, οτι και αν τυπωθει πανω στο wafer. Ξερεις δλδ εκ των προτερων οτι πανω στο wafer θα εχει πχ 1000 λαθη απλωμενα γυρω γυρω. Αυτα δε θα αυξηθουν αν εχεις παραπανω ή μικροτερο density στα τρανζιστορ... θα συμβουν ουτως ή αλλως. Αρα αφου θα συμβουν που θα συμβουν εχεις 2 λυσεις
1) fault tolerant design (δλδ σχεδια οπου ακομα και αν χαλασει κατι να μπορεις να το κανεις disable το κομματι εκεινο του τσιπ που χαλασε και να λειτουργει κατι αλλο παραλληλα, κανονικα).
2) πυκνο design για να ελαχιστοποιησεις τα mm2 και κατ'επεκταση τον αριθμο των προβληματικων chip per wafer.
-
21-03-21, 01:58 Re: Γενικη συζητηση για επεξεργαστες #357
μάλιστα thanx mnp-10. Πίστευα οτι απο επιλογη δεν εχει μεγαλο density η AMD αλλα μαλλον ειναι αδυναμία της
Antec P280 | beQuiet S9-700 | Arctic Liquid Freezer II 240 | MSI X470 Gaming Pro Max | R9 5900X | 3600CL16 32GB | RTX3070 | XPG8200Pro | ROG PG258Q
-
21-03-21, 12:32 Απάντηση: Γενικη συζητηση για επεξεργαστες #358
Συνηθως αυτο που επηρεαζει το density ως design choice ειναι το ποσο ρευμα θελουν να περναει απ'τα τρανζιστορ. Αν θελουν να περναει πολυ ρευμα, "απλωνουν" τα τρανζιστορ για να μη γινονται βραχυκυκλωματα. Οι cpu και gpu της amd που ρουφανε τρελο ρευμα ειναι "απλωμενες" γι'αυτο το λογο. Το πιο dense design τους ειναι ο renoir που θα πηγαινε για laptop και εχει χαμηλοτερα tdp. Τα mobile arm επειδη ειναι low power δεν εχουν τετοια θεματα οπότε ανεβαζουν πολυ τη πυκνοτητα. Ανεβαζοντας τη πυκνοτητα ομως χωρανε περισσοτερα τρανζιστορ και κατ'επεκταση ανεβαινουν οι επιδοσεις παρα το μικροτερο power που απαιτειται.
Χαμηλα volt / χαμηλα hz / χαμηλα watt / πυκνο τσιπ.
Ουσιαστικα το πυκνωμα του τσιπ, βαζοντας πχ +60-80-100% παραπανω τρανζιστορ μπορει να ισοφαρισει τα χαμηλα hz και τη χαμηλη καταναλωση. Κατεβαζεις πχ ενα τσιπακι που θα ετρεχε στα 5ghz, στα 3ghz, το κανεις massively parallel με τεραστιο out of order window οπως το apple που μπορει να εκτελει εντολες που βρισκονται 800 γραμμες μπροστα στη σειρα εκτελεσης (αντι 100-200-300 στα x86), βαζεις παραπανω integer/float/vector units για να κανουν και αυτα παραλληλη επεξεργασια, μεγαλωνεις τις L1 caches, και εχεις τα αποτελεσματα της apple. Αυτο ειναι ακομα πιο ευκολο σε gpu.
-
22-03-21, 02:36 Απάντηση: Γενικη συζητηση για επεξεργαστες #359
-
22-03-21, 11:40 Απάντηση: Γενικη συζητηση για επεξεργαστες #360
Ναι οταν ανεβαζεις cores χωρις να αλλαζεις το ipc, αυτο συμβαινει. Με τα παραπανω (μεγαλυτερο out of order window / more integer-float-vector units / μεγαλυτερες L1 caches) επιταχυνεται η εφαρμογη ακομα και με 1 thread γιατι ανεβαινει το ipc. Το apple πχ μπορει να εκτελεσει γυρω στις 7-8 εντολες ανα κυκλο σε σχεση με τις 4-5 των x86.
Ακομα και τα παλαια vector instructions μπορουν να πανε καλυτερα, αν πχ αντι για 2 vector units των 128 bit (SSE2), βαλεις ...4 ή 8 units... ετσι η cpu θα επεξεργαζεται 2-4πλασιο αριθμο SSE2 εντολων. Αντι να κανεις wider vectors απλα εκτελεις παραλληλα περισσοτερους "στενους" 128bitους. Εν μερει αυτο κανει και το apple. Αντι να παει wider στα 512 bit, απλα αυξησε τα vector units για να εκτελει περισσοτερες vector εντολες ταυτοχρονα. Δεν ειναι κακη προσεγγιση. Και η AMD πχ αν διπλασιασει τα avx2 units θα πιανει αποδοση avx512 των intel, χωρις να εχει βαλει καν avx512, και χρησιμοποιωντας το παλιο avx2 set που εχει μεγαλυτερη υποστηριξη.
Bookmarks