Αυτά γίνονται λόγω 14nm της samsung που είναι φτιαγμένα για χαμηλές συχνότητες.
Λογικά με την πάροδο του χρόνου θα δούμε και πιο επιθετικά turbo boost.
Τα 7nm η Glofo πάντως τα φτιάχνει για 5.0Ghz base clocks, οπότε αργά ή γρήγορα θα δούμε και 16πυρηνους στα 4.5ghz+ στην TR4 πλατφόρμα.
Εμφάνιση 6.271-6.285 από 12005
Θέμα: Τα Νεα Της AMD
-
11-08-17, 15:45 Απάντηση: Τα Νεα Της AMD #6271AMD Threadripper 1920X 12Core/24 Threads, Gigabyte X399 Designare EX, G. Skill 32Gb DDR4 3200Mhz, Samsung 970 EVO 500Gb, Crucial M4 256Gb SSD, 2x Toshiba 3Tb A300, Enermax Galaxy 850Watt, Lg Br-rw, Coolermaster Storm Stryker, Samsung T27A300, Samsung T27C350, Benq W1070 1080P/3D Projector, Sharkoon Shark GK15, Logitech X-230, Enermax Liquidtech 280, Sapphire Nitro R9 390X 8Gb DDR5 (αναμένεται) .
-
11-08-17, 16:13 Re: Απάντηση: Re: Τα Νεα Της AMD #6272
Ειναι συζητησιμο κατα ποσο χρησιμα ειναι στην GPGPU εποχη. Το SIMD στους x86 πραγματι ξεκινησε με τους Pentium MMX, μονο που τοτε δεν υπηρχαν GPUs (οπου GPU = T&L και ανω), οποτε τοτε καλυπτε μια πραγματικη αναγκη (vertex transformation). Τοτε η πλειοψηφια των παιχνιδιων δουλευαν με software rendering και μετραγε πολυ η CPU. Οι 3D accelerators ηταν πιο εξωτικο φρουτο απο οτι ειναι σημερα το GPGPU. Αυτη η δουλεια σημερα γινεται γρηγοροτερα και καλυτερα σε μια GPU.
Αν θυμαμαι καλα, η AMD ειχε πει οτι μακροπροθεσμος στοχος με τα GPGPU/APU/HSA ειναι να ξηλωθει τελειως η FPU απο την CPU και οτιδηποτε εχει να κανει με SIMD/flops, να το κανει η GPU. Ειναι συζητησιμο κατα ποσο μπορει να γινει αυτο πρακτικα ελεω backwards compatibility (σπασιμο apps που χρησιμοποιουν x87 σε i386 και SSE2 σε x86-64).
Καποια πραγματα συνεχιζουν και εξελισσονται για λογους "παραδοσης", ποσο μαλλον οταν μιλαμε για μια εταιρια που δεν εχει κατι να παρουσιασει σε high-end GPUs (το Larrabee πηγε απατο, αλλα τους εμεινε κληρονομια το AVX-512 -> μην πανε τελειως χαμενα τα λεφτα του R&D). Δεν νομιζω να δωσει η Intel την αδεια για AVX512 στην AMD και επισης δεν νομιζω οτι η AMD εχει καμια ιδιαιτερη καψα να πουσαρει CPU flops, οταν εχει επενδυσει τοσα πολλα στο HSA (η Ιntel δεν ειναι καν μελος απο οσο θυμαμαι για καποιον περιεργο λογο). Ακομα και το γεγονος οτι σε AVX η Intel ριχνει ρολογια, θα επρεπε να σου λεει κατι για το trade-off του serial vs parallel (και στις GPUs δεν μπορεις να εχεις υψηλα ρολογια στυλ 3-4 GHz για τον ιδιο λογο, αλλα εν τελει μετραει το τελικο αποτελεσμα -> περισσοτερα flops για SIMD αλγοριθμους).
Δεν καταλαβαινω γιατι τα συγχεεις. SIMD ειχε και ο Pentium MMX, αλλα δεν ειχε multithreading. Αλλο το ενα (με 1 εντολη να παιρνεις αποτελεσμα σε 4 κουτακια σε πραξεις γραμμικης αλγεβρας) και αλλο το αλλο (πολλαπλα CPU cores για ενα σωρο tasks, οχι μονο για SIMD). Αν ηταν το ιδιο πραγμα, ο Amdahl's law δεν θα ισχυε μονο στις CPUs και οι GPUs δεν θα εκαναν perfect scaling αναλογα με τον αριθμο ALUs που εχουν.
Αυτη ειναι η φιλοσοφια των APUs και του HSA.
Εξακολουθω να μην καταλαβαινω γιατι εχεις σκαλωσει με την CPU τοσο πολυ. Ειναι λογω mining? Οταν ολα τα συστηματα (ακομα και mobile) εχουν GPU πλεον, γιατι να μην τρεχει εκει ο SIMD αλγοριθμος? Θα παρεις 2-4x speedup με CPU, ενω με GPU θα παρεις 20-40x.
Αξιοποιησε πρωτα την GPU και αν δεν σου φτανει, τοτε αξιοποιεις και την CPU. Αυτη ειναι η σωστη σειρα.
Ακομα δεν πηρα απαντηση γιατι οι miners προτιμουν να αγοραζουν φορτηγα GPUs και οχι CPUs.
Πες μου εναν SIMD αλγοριθμο που δεν μπορει να τρεξει/γινει port σε GPGPU.
Ακομα και network/encryption apps μπορουν να τρεξουν σε GPU:
http://shader.kaist.edu/packetshader/ (εχει ενδιαφερον το κομματι οπου μιλαει για bottleneck λογω των buses και οχι λογω processing power)
http://shader.kaist.edu/sslshader/
Δηλαδη απο την μια κραζουμε τους FX για χαμηλο IPC και απο την αλλη θα ηταν καλη ιδεα να παμε σε IPC επιπεδου 486? Κατι δεν μου κολλαει εδω. Γιατι να μην παμε σε 386 αντι για 486 θα πει καποιος αλλος? Ακομα λιγοτερο complexity.
Το complexity των συγχρονων CPUs ειναι αναγκαιο για συγκεκριμενα κομματια κωδικα. Για παραδειγμα, χωρις OoO (out-of-order) execution θα ειχες πολυ χαμηλοτερο IPC, κατι που κανει μπαμ σε in-order CPUs (π.χ. Atom, Cell).
OoO ομως δεν θα εβαζες σε GPU, γιατι εκει ειναι αλλος ο στοχος και συνεπως πρεπει να ξοδευτει αλλιως το transistor budget. Γι' αυτο κωδικας με πολλα branches/if-then-else ειναι ακαταλληλος για GPUs. Οι GPUs ειναι για number crunching.
Εδω το δειχνει εκλαικευμενα (serial vs parallel trade-off): https://www.youtube.com/watch?v=-P28LKWTzrI
Ακομα και οι caches εχουν λογο υπαρξης, παρ' ολο που τρωνε αρκετα transistors: https://fgiesen.wordpress.com/2016/0...-cache-levels/
Αυτα τα πραγματα τα ξερουν μηχανικοι (π.χ. Jim Keller) που πληρωνονται 6ψηφια ποσα τον χρονο, δεν ειναι τιποτα αμπαλοι να τους διαφευγει κατι...
Αυτα βλεπει το OS, γιατι αυτα "παρουσιαζει" ο επεξεργαστης στον εξω κοσμο και αυτο συμβαινει για λογους BC. Αν δεν υπηρχε η απαιτηση για BC, θα μπορουσε να ξηλωθει πολυ "legacy baggage" απο την x86.
ΥΓ: Πραγματικα αυτη η συζητηση μου φερνει dejavu απο Cell. Θυμαμαι κοσμο που ισχυριζοταν οτι ηταν πραγματικος octa-core, ενω στην πραγματικοτητα ηταν single-core και μαλιστα μετριων επιδοσεων (χειροτερος απο Pentium 4 του 2004). Αλλα να εχουμε φτασει στο 2017 και να μην μπορουμε να ξεχωρισουμε τα πραγματικα CPU cores απο τα vector units και για ποια δουλεια ενδεικνυται το καθενα?
-
11-08-17, 17:12 Απάντηση: Τα Νεα Της AMD #6273
Κοιτα εγω μαζι σου ειμαι. Ειμαι 100% υπερ του να κανει ο επεξεργαστης 100 δουλειες σε ενα κυκλο.
Το προβλημα ομως ειναι οτι η ιδια η Intel εχει κανει πολυ επιθετικο market segmentation, με αποτελεσμα το higher end AVX να ειναι προσβασιμο μονο στους επισης higher end επεξεργαστες, με τις αναλογες απαιτησεις σε μητρικη μνημες κλπ.
Κοιτα ποσοι επεξεργατσες εχουν AVX 512.
Αν βγει ο Coffeelake και εχει ενεργοποιημενο το subset, απο τον Pentium μεχρι τον Core i7, τοτε κατι θα κανουμε και τοτε θα ασχοληθει και ο εκαστοτε προγραμματιστης να χρησιμοποιησει αυτες τις εντολες. Ασε που εχουν κοστος και σε καταναλωση. Κατι που δεν αρεσει καθολου στα laptops, που καλως η κακως εχουν τεραστιο μεριδιο αγορας για τους απλους χρηστες.
Αυτο το μειονεκτημα η AMD το καταπολεμαει πουλωντας περισσοτερους cores αντι για δυνατοτερους. Χωρις αυτο να σημαινει οτι ειναι αδυναμοι, οπως του μπουλντοζα.
Πχ σε AVX sensitive operations οπως το HEVC encoding ο οκταπυρηνος 1700 ειναι λιγο πιο αργος απο τον τετραπυρηνο 7700Κ.
Αλλα σε αλλα που χρησιμοποιουν πιο βατες εντολες σε συνδυασμο με καλυτερο multi threading, η διαφορα υπερ του Ryzen ειναι ακομα μεγαλυτερη.
Συνεπως ερχομαστε στο square one και στο οτι ο καθενας αγοραζει με βαση τις αναγκες του. Δεν υπαρχει το τελειο. Τελειος θα ειναι μονο ο Coffeelake 8700k!
Και μονο παντως που εχουμε φτασει να κανουμε ΣΥΓΚΡΙΣΗ AMD vs Intel ειναι τεραστιο βημα. Ακομα χειροτερα δε, στο οτι η AMD κερδιζει στα μισα benchmarks μετα απο δε ξερω και γω ποσα χρονια, με κανει να ειμαι.PC1:12400f,4070ti,32GB,z690,Gigabyte Gen4 7000 1TB, PC2:8600k,3060ti,32GB,z370,GAMMIX S11 Pro 1TB
PC3:2700k,GTX 1070,16GB,P67,SandiskSSDPro240GB, PC4:2500k,rx 6600,16GB,P67,MX500-1TB
PC5:Lenovo Thinkcentre M71E
Reviews: ATI 4870X2, ΑΤΙ 4850,test GTX 970 σε 3 CPUs
-
11-08-17, 20:07 Απάντηση: Re: Απάντηση: Re: Τα Νεα Της AMD #6274
Βασικα δεν ειναι συζητησιμο. Απαραιτητα ειναι. Για ολες τις χρησεις, απο ενα κινητο τηλεφωνο (neon στα arm) ως τα server. Εκτος αν καποιος θελει να σερνεται, οπότε, οκ, πασο
Το SIMD στους x86 πραγματι ξεκινησε με τους Pentium MMX, μονο που τοτε δεν υπηρχαν GPUs (οπου GPU = T&L και ανω), οποτε τοτε καλυπτε μια πραγματικη αναγκη (vertex transformation). Τοτε η πλειοψηφια των παιχνιδιων δουλευαν με software rendering και μετραγε πολυ η CPU. Οι 3D accelerators ηταν πιο εξωτικο φρουτο απο οτι ειναι σημερα το GPGPU. Αυτη η δουλεια σημερα γινεται γρηγοροτερα και καλυτερα σε μια GPU.
Το πρωτο βημα ελαφρυνσης εγινε στο x64 με 16 registers και 16 στα SSE. Εκτοτε η μονη αυξηση που ειχαμε ειναι στο avx512 που πλεον εχει παει τους SSE/AVX registers στους 32. Με 32x512 bit, εχεις 2kbyte (!!) δεδομενων ανα πασα στιγμη επανω στους registers.
Αν θυμαμαι καλα, η AMD ειχε πει οτι μακροπροθεσμος στοχος με τα GPGPU/APU/HSA ειναι να ξηλωθει τελειως η FPU απο την CPU και οτιδηποτε εχει να κανει με SIMD/flops, να το κανει η GPU. Ειναι συζητησιμο κατα ποσο μπορει να γινει αυτο πρακτικα ελεω backwards compatibility (σπασιμο apps που χρησιμοποιουν x87 σε i386 και SSE2 σε x86-64).
Καποια πραγματα συνεχιζουν και εξελισσονται για λογους "παραδοσης", ποσο μαλλον οταν μιλαμε για μια εταιρια που δεν εχει κατι να παρουσιασει σε high-end GPUs (το Larrabee πηγε απατο, αλλα τους εμεινε κληρονομια το AVX-512 -> μην πανε τελειως χαμενα τα λεφτα του R&D). Δεν νομιζω να δωσει η Intel την αδεια για AVX512 στην AMD και επισης δεν νομιζω οτι η AMD εχει καμια ιδιαιτερη καψα να πουσαρει CPU flops, οταν εχει επενδυσει τοσα πολλα στο HSA (η Ιntel δεν ειναι καν μελος απο οσο θυμαμαι για καποιον περιεργο λογο).
Ακομα και το γεγονος οτι σε AVX η Intel ριχνει ρολογια, θα επρεπε να σου λεει κατι για το trade-off του serial vs parallel (και στις GPUs δεν μπορεις να εχεις υψηλα ρολογια στυλ 3-4 GHz για τον ιδιο λογο, αλλα εν τελει μετραει το τελικο αποτελεσμα -> περισσοτερα flops για SIMD αλγοριθμους).
Δεν καταλαβαινω γιατι τα συγχεεις. SIMD ειχε και ο Pentium MMX, αλλα δεν ειχε multithreading. Αλλο το ενα (με 1 εντολη να παιρνεις αποτελεσμα σε 4 κουτακια σε πραξεις γραμμικης αλγεβρας) και αλλο το αλλο (πολλαπλα CPU cores για ενα σωρο tasks, οχι μονο για SIMD). Αν ηταν το ιδιο πραγμα, ο Amdahl's law δεν θα ισχυε μονο στις CPUs και οι GPUs δεν θα εκαναν perfect scaling αναλογα με τον αριθμο ALUs που εχουν.
Το ενα ειναι του στυλ, στο 1 thread τρεχει το youtube, στο αλλο τρεχει το mp3. Δλδ καθημερινο multitasking οπου τα tasks κανουν map σε different threads.
Το αλλο multithreading ειναι αυτο με το οποιο θελουν να κανουν scale τις εφαρμογες, κανοντας assign πολλαπλα threads, μεσα απ'την ιδια εφαρμογη, σε πολλαπλα κομματια δεδομενων που πρεπει να επεξεργαστουν.
Το 2ο ειδος multithreading εχει παραλληλισμο με τα SIMD, οχι το πρωτο. Το multithreading ενος encoding/compression/encryption/hashing library ειναι στις περισσοτερες περιπτωσεις ισοδυναμο με το multi-streaming. Αντι να πεις, το καθε thread απ'τα 8 θα παρει 1 hash, λες το καθε thread θα παρει πακετο 8 hashes in parallel, και ετσι στα 8 threads αντι για 8 hashes παραλληλα θα κανω 64 hashes. Μπορεις βεβαια να καις και ρευμα τσαμπα κανοντας 1 hash / thread και να ικανοποιεισαι βλεποντας οτι η cpu ειναι στο "100%", οτι "δουλευει ολα τα thread", και να λες, πωπω κομματια παει
Εξακολουθω να μην καταλαβαινω γιατι εχεις σκαλωσει με την CPU τοσο πολυ. Ειναι λογω mining? Οταν ολα τα συστηματα (ακομα και mobile) εχουν GPU πλεον, γιατι να μην τρεχει εκει ο SIMD αλγοριθμος? Θα παρεις 2-4x speedup με CPU, ενω με GPU θα παρεις 20-40x.
Ακομα δεν πηρα απαντηση γιατι οι miners προτιμουν να αγοραζουν φορτηγα GPUs και οχι CPUs.
Πες μου εναν SIMD αλγοριθμο που δεν μπορει να τρεξει/γινει port σε GPGPU.
Δηλαδη απο την μια κραζουμε τους FX για χαμηλο IPC και απο την αλλη θα ηταν καλη ιδεα να παμε σε IPC επιπεδου 486? Κατι δεν μου κολλαει εδω. Γιατι να μην παμε σε 386 αντι για 486 θα πει καποιος αλλος? Ακομα λιγοτερο complexity.
Το 486 δουλευε μονιμως στο 100% γιατι με 1 ALU ηταν guaranteed οτι αυτο θα δουλευει συνεχεια. Δε γινοταν αλλιως. Οταν τα ALU αυξηθηκαν σε 2 σε 3 σε 4, ο κωδικας επρεπε να ξαναγραφτει. Το πρωτο προβλημα του pentium ηταν ακριβως αυτο: Ξαφνικα επρεπε να γραφεις με λογικη superscalar. Αντι μια σειριακη προσθεση οπου α=α+β+γ+δ+ε+ζ, επρεπε να παρεις (α+β)+(γ+δ)+(ε+ζ), κτλ κτλ ωστε να κανει 2 προσθεσεις μαζι. Εν ετος 2017, κοντευουμε 2018, ο gcc 7.2 (που ειναι καλος compiler) κανει ακομα generate σειριακο κωδικα σε προσθεσεις και γελαει ο κοσμος.
Αν θες λοιπον να φτιαξεις ενα πυριτιο που ολο θα δουλευει guaranteed αναλογα ποσο φορτο του στελνεις, το ιδανικο ειναι να εχεις 1 ALU per core. Το 2ο/3ο/4ο κατα πασα πιθανοτητα θα καθεται εκτος αν ολος ο κωδικας ειναι γραμμενος σε 3 ή 4 virtual streams οπου εχεις
<εντολη για τη 1η ακολουθια>
<εντολη για τη 2η ακολουθια>
<εντολη για τη 3η ακολουθια>
<εντολη για τη 4η ακολουθια>
<εντολη για τη 1η ακολουθια>
<εντολη για τη 2η ακολουθια>
<εντολη για τη 3η ακολουθια>
<εντολη για τη 4η ακολουθια>
... ωστε να παιρνει 4 μαζι σε καθε εντολη, κανοντας assign την καθε εντολη σε ξεχωριστο ALU. Αν κανεις ενα objdump -d εκτελεσιμο >temp.txt και ανοιξεις το temp.txt θα δεις οτι ουδεμια σχεση εχει ο κωδικας που τρεχουμε με τετοια λογικη. Προσπαθει ο compiler αλλα ουτε καν. Και αν εχεις και σειριακο κωδικα οπου το ενα αποτελεσμα περιμενει το αλλο, αστο... απ'τα 4 alu, δουλευει το 1 και αυτο με lag.
Αρα αμα θες το πυριτιο που εχεις φτιαξει να δουλευει στο 100%, ολη την ωρα, ανεξαρτητως κωδικα, το 1 ALU per core ειναι μονοδρομος. Και στα καπακια 2πλασιαζεις το core count.
Το complexity των συγχρονων CPUs ειναι αναγκαιο για συγκεκριμενα κομματια κωδικα. Για παραδειγμα, χωρις OoO (out-of-order) execution θα ειχες πολυ χαμηλοτερο IPC, κατι που κανει μπαμ σε in-order CPUs (π.χ. Atom, Cell).
Αυτα τα πραγματα τα ξερουν μηχανικοι (π.χ. Jim Keller) που πληρωνονται 6ψηφια ποσα τον χρονο, δεν ειναι τιποτα αμπαλοι να τους διαφευγει κατι...
- - - Updated - - -
Ειναι υπεροπλο... εγω θελω να πιστευω οτι επειδη παραδοσιακα το marketing της intel ηθελε να εχει +1 ins set πιο πανω απ'την amd στα ραφια, και επειδη πλεον η amd δινει avx2 παντου, ΙΣΩΣ να το σκεφτουν να το δωσουν και σε i5/i3. Ισως. Αν δε το κανουν με τη καφετιερα, θα το κανουν στο κανονι Καποια στιγμη πρεπει να γινει...
Αν βγει ο Coffeelake και εχει ενεργοποιημενο το subset, απο τον Pentium μεχρι τον Core i7, τοτε κατι θα κανουμε και τοτε θα ασχοληθει και ο εκαστοτε προγραμματιστης να χρησιμοποιησει αυτες τις εντολες. Ασε που εχουν κοστος και σε καταναλωση. Κατι που δεν αρεσει καθολου στα laptops, που καλως η κακως εχουν τεραστιο μεριδιο αγορας για τους απλους χρηστες.
Συνεπως ερχομαστε στο square one και στο οτι ο καθενας αγοραζει με βαση τις αναγκες του. Δεν υπαρχει το τελειο. Τελειος θα ειναι μονο ο Coffeelake 8700k!Τελευταία επεξεργασία από το μέλος MNP-10 : 11-08-17 στις 19:48.
-
11-08-17, 21:12 Re: Τα Νεα Της AMD #6275
@MNP10
Αυτη την στιγμη το GPGPU εχει δραματικα μεγαλυτερο marketshare απο το AVX512 (μονο high-end Intel CPUs). Μεχρι και οι malware programmers πηραν πρεφα το τεραστιο install base των GPUs και πλεον τις κανουν target για πιο αποδοτικο mining. Καλυτερη αποδειξη απο αυτο δεν υπαρχει.
Τα παραπονα σου θα πρεπει να τα κατευθυνεις στην Intel που δεν το βαζει και στους Celeron (ενω μπορει). Οι προγραμματιστες δεν εχουν κανενα λογο να κανουν target ενα niche instruction set. Εδω σε PC games δεν υποστηριζουν SSE4.1 (Penryn) επειδη δεν υπαρχει σε κατι αρχαιους Phenom. Για AVX512 θα περιμενεις πολυυυυυυ ακομα, αν γινει ποτε mainstream...
Για τα bits, ξαναγυρναμε στα του marketing. Μεχρι και τα Dreamcast/PS2 ειχαμε τα περιφημα bit wars (128-bit τα εν λογω vector units). Εκτοτε επαψαν να εχουν σημασια. Οι Maxwell εχουν 512-bit registers και κανεις δεν τις προμοταρει ως 512-bit processors. Ειναι παραπλανητικο, μιας και συνηθως αναφερομαστε στο addressing με τα bits και οχι στο vector unit width. Αναγκη για 128-bit addressing ισως και να μην υπαρξει ποτε.
Τα registers ειναι γνωστο οτι ειναι περισσοτερα, αλλο αν δεν φαινονται ολα προς τα εξω.
Τα datasets δεν ειναι προβλημα οταν οι GPUs πλεον ευκολα εχουν 8GB GDDR5/HBM2, που συν τοις αλλοις εχουν και πολλαπλασιο memory bandwidth απο τις DDR των CPU, πραγμα ιδανικο για παραλληλισμο. Τι ακριβως δεν μπορεις να χωρεσεις σε 8GB (π.χ. RX 480)? Η ISA της Vega εχει μεχρι και ειδικες εντολες για mining (που δεν υπαρχουν σε CPU). Ξαναλεω, θα δυσκολευτεις πολυ να βρεις SIMD αλγοριθμο που δεν μπορει να γινει port σε GPGPU (το οτι δεν το εχει κανει καποιος μεχρι τωρα για το ταδε, δεν σημαινει οτι δεν γινεται)... ουτε το Bitcoin ξεκινησε απο GPUs. Παντα η ευκολη τεμπελικη λυση να ξεκινησεις να γραψεις κατι ειναι η CPU (40 χρονια φουρναρης vs 10 για το GPGPU). Δεν ειμαστε ομως και στο 2007 που τα Compute shaders ηταν εξωτικο φρουτο για λιγους.
Οι Ryzen θα αποκτησουν GPU οταν πεσουν τα nm. Ακομα ειναι νωρις.
Στο "δεν τους ενδιαφερει το IPC" ειλικρινα δεν ξερω τι να σου απαντησω, αν το πιστευεις πραγματικα αυτο δηλαδη. Ακομα κι αν δεν νοιαζονται οι μηχανικοι τους (αυτοι που σχεδιασαν τον Ryzen), σιγουρα το PR department θα νοιαζοταν πολυ να κανει 50% -> 250% IPC increase (αν ηταν τεχνικα εφικτο) με περισσοτερες ALUs. Αν ειναι τοσο απλο, γιατι να μην στειλουμε μια μαζικη επιστολη στην AMD με τις προτασεις μας? Δεν θα τους χαλασει να ανοιξει δραματικα η ψαλιδα με την Intel.
-
12-08-17, 21:17 Απάντηση: Re: Τα Νεα Της AMD #6276
Δε χρειαζεται να κανουν target... multipath code. If cpuid=ταδε, jmp το ταδε.
Τα datasets δεν ειναι προβλημα οταν οι GPUs πλεον ευκολα εχουν 8GB GDDR5/HBM2, που συν τοις αλλοις εχουν και πολλαπλασιο memory bandwidth απο τις DDR των CPU, πραγμα ιδανικο για παραλληλισμο. Τι ακριβως δεν μπορεις να χωρεσεις σε 8GB (π.χ. RX 480)? Η ISA της Vega εχει μεχρι και ειδικες εντολες για mining (που δεν υπαρχουν σε CPU). Ξαναλεω, θα δυσκολευτεις πολυ να βρεις SIMD αλγοριθμο που δεν μπορει να γινει port σε GPGPU (το οτι δεν το εχει κανει καποιος μεχρι τωρα για το ταδε, δεν σημαινει οτι δεν γινεται)...
Στο "δεν τους ενδιαφερει το IPC" ειλικρινα δεν ξερω τι να σου απαντησω, αν το πιστευεις πραγματικα αυτο δηλαδη. Ακομα κι αν δεν νοιαζονται οι μηχανικοι τους (αυτοι που σχεδιασαν τον Ryzen), σιγουρα το PR department θα νοιαζοταν πολυ να κανει 50% -> 250% IPC increase (αν ηταν τεχνικα εφικτο) με περισσοτερες ALUs. Αν ειναι τοσο απλο, γιατι να μην στειλουμε μια μαζικη επιστολη στην AMD με τις προτασεις μας? Δεν θα τους χαλασει να ανοιξει δραματικα η ψαλιδα με την Intel.
2 cpu cores με 4 ALUs
vs
4 cpu cores με 2 ALUs
Το πρωτο απαιτει ιδανικες συνθηκες κωδικα για να εχει 4ins/cycle throughput per core (ανυπαρκτες πραγματικες εφαρμογες τετοιου στυλ), το δευτερο θα ειναι σχεδον συνεχεια τιγκα στα pipelines επιτυγχανοντας χρηση μεταξυ 1.5 και 1.8 ALU σε συνεχη βαση.
Οποτε το να εχεις 4 cores που σου δινουν πχ 1.6 - 1.8 ins/cycle αντι 2 cores που σου δινουν 2.0-2.5ins/cycle ειναι win.
Το αλλο σκελος του IPC αφορα το ποσο γρηγορα τελειωνει μια εντολη το ALU. Πχ αν ενας πολλαπλασιασμος θελει 3 cycles ή 10 cycles. Σ'αυτο παντα καταβαλλεται η μεγιστη προσπαθεια για να ειναι οσο το δυνατον λιγοτερο και δε παιζει ρολο ο αριθμος των ALU.
- - - Updated - - -
Κατεβασα το cinebench και το εκανα disassemble να δω τις εντολες που στελνει στον επεξεργαστη. Εβαλα για keyword ymm, που ειναι το ονομα των avx registers. Εκτος απο 5-6 πραξεις στο 99% του αρχειου, δεν εχει τιποτα μεσα. Ολα απλες εντολες και SSE με instruction set 15ετιας.
Τωρα καταλαβα γιατι το φεβρουαριο ολα τα leaks δειχνανε cinebench και cinebench. Γιατι το cinebench ειναι ο πατος του πατου απο αποψη hardware utilization. Και αυτο το προγραμμα τωρα βασιζεται σε επαγγελματικο προγραμμα για στουντιο κτλ? Τι διαλο, μαζοχες ειναι οι content creator να θελουν να rendαρουν σε 2-4-8x χρονους?
-
13-08-17, 17:07 Απάντηση: Τα Νεα Της AMD #6277Επιτέλους το ελάχιστο δυνατό, ευέλικτο, και ψηφιακό κράτος. Με διαρκή αξιολόγηση.
-
23-08-17, 20:49 Απάντηση: Τα Νεα Της AMD #6278
WHAT IS AMD DOING IN LA? HELPING MORE FILMMAKERS ACHIEVE HOLLYWOOD-CALIBER VFX
https://www.digitaltrends.com/comput...ion-pipelines/
-
24-08-17, 21:11 Re: Τα Νεα Της AMD #6279
Zen/Vega APU info:
https://www.guru3d.com/news-story/ry...u-spotted.html
-
01-09-17, 09:57 Απάντηση: Τα Νεα Της AMD #6280
Βγήκε και ο Threadripper 1900X.
€650 στα ελληνικά καταστήματα.
Σχετικά λογική τιμή, με βάση τα $550 εκκίνησης.Επιτέλους το ελάχιστο δυνατό, ευέλικτο, και ψηφιακό κράτος. Με διαρκή αξιολόγηση.
-
01-09-17, 11:47 Re: Τα Νεα Της AMD #6281
Το πρόβλημα των Threadripper και i9 είναι το υπερβολικά μικρό κοινό στο οποίο απευθύνονται. Πρακτικά, δεν έχουν λόγο ύπαρξης αυτά τα chip.
Antec P280 | beQuiet S9-700 | Arctic Liquid Freezer II 240 | MSI X470 Gaming Pro Max | R9 5900X | 3600CL16 32GB | RTX3070 | XPG8200Pro | ROG PG258Q
-
01-09-17, 11:53 Απάντηση: Re: Τα Νεα Της AMD #6282"If you pay peanuts you get monkeys"
------------------------------------------------------------------------------------
Άλλοι καταλαβαίνουν ότι διαβάζουν και άλλοι διαβάζουν ότι καταλαβαίνουν
------------------------------------------------------------------------------------
Η αλήθεια που δεν σας λένε, i7 2600K vs i7 8700K σημειώσατε Χ
-
01-09-17, 11:59 Re: Απάντηση: Re: Τα Νεα Της AMD #6283
-
01-09-17, 12:02 Απάντηση: Re: Απάντηση: Re: Τα Νεα Της AMD #6284"If you pay peanuts you get monkeys"
------------------------------------------------------------------------------------
Άλλοι καταλαβαίνουν ότι διαβάζουν και άλλοι διαβάζουν ότι καταλαβαίνουν
------------------------------------------------------------------------------------
Η αλήθεια που δεν σας λένε, i7 2600K vs i7 8700K σημειώσατε Χ
-
01-09-17, 12:36 Re: Τα Νεα Της AMD #6285
Μα πόσους από μας αφορούν οι Threadripper?
δεν είναι κάτι εξεικευμένο?
Παρόμοια Θέματα
-
Στην αγορά η νέα σειρά καρτών γραφικών 9000 της nVidia - Μειώσεις τιμων απο AMD
Από flamelab στο φόρουμ ΕιδήσειςΜηνύματα: 65Τελευταίο Μήνυμα: 25-02-08, 22:35 -
Νέα μέτρα της Ε.Ε. για την αντιμετώπιση της διαδικτυακής πειρατείας
Από opener στο φόρουμ Γεγονότα και ΑπόψειςΜηνύματα: 0Τελευταίο Μήνυμα: 12-12-07, 08:06 -
Απόφαση της ΕΕΤΤ σχετικά με τα νέα πακέτα της ΟΤΕ Α.Ε.
Από EvilHawk στο φόρουμ ΕιδήσειςΜηνύματα: 195Τελευταίο Μήνυμα: 16-10-07, 02:35 -
Το μερίδιο αγοράς της AMD σε υπολογιστές γραφείου AMD υπερβαίνει το 20% στο 3Q
Από aesir στο φόρουμ ΕιδήσειςΜηνύματα: 5Τελευταίο Μήνυμα: 03-11-05, 20:47
Bookmarks